SlideShare a Scribd company logo
1 of 55
钟远薪 (yuanxinz@gmail.com)
东莞职业技术学院 图书馆
2018年10月11日
图书馆大数据统计与分析设计
1. 什么是大数据?
2. 图书馆大数据应用案例与产品扫视
3. 图书馆大数据统计与分析设计
4. 一点思考
CONTENTS
什么是大数据?
• 什么是大数据?
• 大数据的技术体系
什么是大数据?
4
维基百科:
大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。
大数据的4V特征
5
• 非结构化数据的超大规模和增长
• 总数据量的80~90%
• 比结构化数据增长快10倍到50倍
• 是传统数据仓库的10倍到50倍
体量Volume
• 大数据的异构和多样性
• 很多不同形式(文本、图像、 XML、html、音视频、机器数据)
• 无模式或者模式不明显
• 不连贯的语法或句义
多样性Variety
• 大量的不相关信息
•对未来趋势与模式的可预测分析
•深度复杂分析(机器学习、人工智能Vs传统商务智能(咨询、报告等)
价值密度Value
•实时分析而非批量式分析
•数据输入、处理与丢弃
•立竿见影而非事后见效
速度Velocity
大数据从何而来?
6
感知 交流 计算
大数据有多大?
7
《红楼梦》含标点87万字,1GB约等于671部红楼梦,639TB约等于4,3906万部,约等于16个中国国家图书馆藏书(2700万册)的信息量。
• 1个 1TB SATA硬盘完全存取一次。
需要约90分钟。
• 100个 1TB SATA硬盘,每个存取1GB数据,采用并行访问,
运行速度将提高100倍。
并行计算
分布式存储
• Hadoop Distributed File System将巨大的数据变成大量数据的数据。
• 大文件会被拆分成多个块,每个块作为独立的单元进行存储。
• 数据块冗余存储保证容错性。
大数据技术的实质
8
内存计算
• 去除硬盘读写开销,提高处理速度。
• 从HDFS中读数据,运算中数据存放在内存。
• 建立RDD只读数据集,创建后不能修改,进行整个数据集的计算。
大数据技术栈
9
大数据
技术
采集与预处理技
术
数据抓取
数据导入
自动采集
数据清洗
数据集成
数据变换
数据归约
存储与处理
技术
HDFS/HBase
NoSQL
YARN
….
Hadoop
MapReduce
Spark
Storm….
Spark Mlib
Mahout
…..
挖掘技术
统计与分析
分类
聚类
关联规则
预测模型
可视化技术
10
大数据案例
11
沃尔玛
啤酒加尿布
Netflix
纸牌屋
麻省理工
利用手机定
位数据和交
通数据进行
城市规划
QQ圈子
把前女友推
荐给未婚妻
大数据价值
12
感知现在
预测未来
大数据是一种
统计方法
提供了认知世
界的新途径
让机器变得更
聪明、更强大
图书馆大数据应用案例与产品扫视
• 应用案例概览
• 代表性产品分析
14
15
16
17
18
19
图书馆应用案例扫视
20
借阅排行榜
年度阅读报告
即时服务数据
年度服务报告
借阅账单
图书馆应用案例扫视
21
图书馆应用案例扫视
22
阅读推广 资源利用 辅助决策 个性服务
• 阅读账单
• 年度报告
• 数据展示墙
• 图书排行榜
• 阅读达人
• ……
• 馆藏挖掘
• 资源整合与发现
•……
• 服务数据统计
• 用户群体分析
• 借阅趋势
• 用户荐购
• ……
• 行为数据采集与分析
• 喜好猜测,图书推荐
• 个性排序
• ……
代表性产品
23
管理系统数字资源与服务 互联网空间与设备
超星
24
超星
25
馆藏资源
分析
资源利用
分析
读者行为
数据
用户
画像
精准推送
读者到馆
情况分析
图创
262018湖南全省阅读大数据发布会
图创
27
读者借阅行为分
析,阅读报告单
图书推荐,各种
终端设备推送
综合展示智慧墙
视频客流统计
个性化服务
数据分析与
辅助决策
联创
28
联创
29
百度
30
百度
31
对比
32
图书 数字资源 互联网资源
空间、设备
数据
智能技术 读者行为 数据展示 个性化服务 辅助决策
超星
馆藏分析
借阅排行
阅读报告
资源发现
资源统计
利用分析
资源推送
无
门禁
大屏机
电纸书
无
借阅
搜索
到馆
智慧墙
移动端
用户画像
精准推送
资源采访等
图创
馆藏分析
借阅排行
阅读报告
图书推荐
无 无
门禁
视频客流
终端设备推
送
智能机器人 借阅
展示墙
移动端
精准推送
借阅数据分
析辅助
联创 借阅分析
资源统计
利用分析
无
门禁
自助设备
座位
空间
无
借阅
空间利用
展示墙 无
不清晰
百度 无
资源发现
资源统计
利用分析
百度资源
学术资源
门禁
移动设备
人脸识别
语音识别
图像识别与搜索
AI意图识别
搜索
利用
到馆
移动端
用户画像
精准推送
不清晰
图书馆大数据统计与分析设计
• 设计原则
• 设计思路
• 数据来源
• 技术选择
设计原则
34
多大?
比大更重要的是
数据的复杂性,
有时甚至大数据
中的小数据如一
条借阅记录就有
对应的价值
设计原则
35
多全?
大数据规约本身
就是一个剔除数
据的过程,相较
于全的数据,符
合需求特征的数
据才是最重要的
设计原则
36
多远?
大数据技术的发
展已迈入一个相
对成熟期,关键
是掌握其应用原
理,采用技术外
包形式实现需求。
设计思路
37
从目的出发:
设定目标,通过提问题,
进行数据挖掘,
提出达到目的
的最佳途径和对策。
从现状出发:
通过分析目前的大数据,
寻找规律、关联,
然后聚类、排序,
进行推理、发现。
图书馆产生哪些数据
38
用户信息及行为数据 外界互联数据
电子设备等硬件数据 信息化支撑平台数据
图书馆物联网数据
馆藏资源数据
监控数据
更多……
大数据来源
39
资源
服务用户
大数据来源
40
通道机、门禁、视频监控
移动热点、GPS
空间、座位
流动数据
空间资源
互联网文档
互联网资源
他馆馆藏
他馆资源
馆藏图书
电子资源
特色资源
馆藏资源
大数据来源
41
• 应重视独占性文献资源、地方性文献资源、优势性文献资源的开发;
• 不仅重视结构化的文献数据,更要重视非结构化数据的采集、储存、分析、管理和服务。
大数据来源
42
用户群
体分析
用户
特征
借阅
行为
到馆
行为
用户第三
方数据
交互
数据
大数据来源
43
• 数据采集:
−书目数据、用户数据、流通数据、参考咨询数据、OPAC查询数据、图书馆网站利用数
据、数据库利用数据、门禁系统数据、服务参与数据等;
−通过机构内第三方平台用户数据;
−通过互联网API、爬虫采集相关数据;
−购买用户数据。
• 数据分析: 从用户属性及不同维度进行分析挖掘,进行群体研究、个案研究。
• 数据利用:作为改进资源建设与服务的重要依据。
大数据来源
44
日志
数据
交互
数据
各类服务
统计
媒体
数据
大数据来源
45
技术选择
46
• 图书馆供应商产品
− 超星、图创、联创等一线厂商的产品
− 简单、高效
− 意味着全盘接受他们提供的解决方案
• 大数据基础产品与工具
− 百度、阿里云等大数据套件
− 需掌握相应技术,需具备技术团队
− 有更多的可能性
• 自行搭建数据平台
图书馆大数据用途
47
阅读推广 资源利用 辅助决策 个性服务
• 阅读账单
• 年度报告
• 数据展示墙
• 图书排行榜
• 阅读达人
• 数字阅读,碎片阅读
• ……
• 馆藏挖掘
• 资源整合与发现
• 资源组织与关联
• 排序与分面显示
• ……
• 服务跟踪
• 用户群体分析
• 借阅趋势
• 采订剔旧
• ……
• 行为数据采集与分析
• 用户画像
• 喜好猜测,资源推荐
• 个性排序
• 特征匹配,足迹预测
• 推荐同好,发展读者
• 用户社区
• ……
一点思考
• 大数据时代的契机与挑战
• 如何面对
大数据时代图书馆迎来的契机
49
01 • 提供了处理问题的新思想、新方法和新工具。
• 商业模式的变化:从硬件设备、软件授权向数据服务转变。
技术环境改变
02 • 馆藏资源的数字化:影像、口述历史、族谱、碑拓、字画、文书、文物……
• 馆藏资源采集的多样化:图像、视频、科学数据集、3D模型、慕课、游戏、VR、设计
文案、动态数据…
• 非传统文献型数据库的供给:音频类、视频类、图像类、模型类、 互动性等数据库……
资源结构改变
03 • 读者需求数据:借阅日志、信息服务日志……
• 读者行为数据:入馆、位置信息、监控、行为习惯……
• 社交网络数据:社交网络关联与数据上传、社交网络数据授权……
使数据采集成为可能
大数据时代图书馆面临的挑战
50
图书馆普遍缺乏大数据的处理能力和经验。
用户隐私数据的所有权和使用权并没有被
清晰地界定。
基础架构外部化,大量数据的集中存储增
加了泄漏的风险。
用户隐私数据的保护。 商业利益与知识产权风险。
缺乏需求分析人才、极度缺乏数据挖掘、
组织、分析与管理技术人才。
用户隐私数据的合理利用。
公共安全,大数据分析使得黑客的攻击更
为精准,也提供了更多的攻击机会。
图书馆技术人员如何面对大数据时代
51
积极
积极面对大数据的挑战,积
极学习大数据技术,积极应
用大数据。
客观
大数据技术只是
提供工具。
理性
图书馆首先是应用
者,才是推动者。
一、态度
二、思维
三、尝试
四、推动
图书馆技术人员如何面对大数据时代
52
培养大数据思维
改变看待数据的角度
关注数据,掌握数据,
树立数据先行、数据导向的思想
培养外部数据意识,掌握多维度数据
关联分析的思维能力
一、态度
二、思维
三、尝试
四、推动
图书馆技术人员如何面对大数据时代
53
理解大数据技术
运用大数据工具
了解市场的大数据产品的技术原理、
核心价值和应用案例。
认真看待图书馆供应商的大数据产品,
共同推动行业正确发展。
尝试使用大数据工具,尝试上云。
一、态度
二、思维
三、尝试
四、推动
图书馆技术人员如何面对大数据时代
5454
从服务中寻找新的模式
运用大数据的思维,重新剖析图书馆的
服务,关注图书馆服务中的数据流。
尝试采集并分析服务中产生的数据,
了解图书馆服务数据的另一面。
借鉴互联网应用,连接用户的第三方
数据、互联网数据。
提出新的服务模式,并推动它。
一、态度
二、思维
三、尝试
四、推动
学科
服务
信息
检索课
查收
查引
自助
借还
学习
空间
自助文印
电子资源
门禁
系统
阅读
推广
新生
入馆
教育
读者
培训
论文
提交
科技
查新
谢谢!
广东,番禺
2018年10月11日
本PPT模板来自islide(www.islide.cc)

More Related Content

Similar to Introduction of libraries' big data in China

淘宝数据可视化[2010 SD2.0]
淘宝数据可视化[2010 SD2.0]淘宝数据可视化[2010 SD2.0]
淘宝数据可视化[2010 SD2.0]KennyZ
 
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況Jazz Yao-Tsung Wang
 
IT445_Week_11.pdf
IT445_Week_11.pdfIT445_Week_11.pdf
IT445_Week_11.pdfAiondBdkpt
 
當資料科學家不須花大量時間蒐集/清洗數據-2015 R Taiwan研討會分享
當資料科學家不須花大量時間蒐集/清洗數據-2015 R Taiwan研討會分享當資料科學家不須花大量時間蒐集/清洗數據-2015 R Taiwan研討會分享
當資料科學家不須花大量時間蒐集/清洗數據-2015 R Taiwan研討會分享Liang-Chuan Huang
 
Npo与云计算
Npo与云计算Npo与云计算
Npo与云计算jianboolee
 
Big Data 101 一 一個充滿意圖與關聯世界的具體實現
Big Data 101 一 一個充滿意圖與關聯世界的具體實現Big Data 101 一 一個充滿意圖與關聯世界的具體實現
Big Data 101 一 一個充滿意圖與關聯世界的具體實現Fred Chiang
 
博晓通企业介绍和典型客户201504 (完整版)
博晓通企业介绍和典型客户201504 (完整版)博晓通企业介绍和典型客户201504 (完整版)
博晓通企业介绍和典型客户201504 (完整版)Yu Zhang
 
N世代情報收集術
N世代情報收集術N世代情報收集術
N世代情報收集術基欽 劉
 
Realtime analytics with Flink and Druid
Realtime analytics with Flink and DruidRealtime analytics with Flink and Druid
Realtime analytics with Flink and DruidErhwen Kuo
 
查礼 -大数据技术如何用于传统信息系统
查礼 -大数据技术如何用于传统信息系统查礼 -大数据技术如何用于传统信息系统
查礼 -大数据技术如何用于传统信息系统hdhappy001
 
從統計到資料科學
從統計到資料科學從統計到資料科學
從統計到資料科學Terence Huang
 
Dtcc ibm big data platform 2012-final_cn
Dtcc ibm big data platform 2012-final_cnDtcc ibm big data platform 2012-final_cn
Dtcc ibm big data platform 2012-final_cnyp_fangdong
 
Business intelligent 概論 棅易
Business intelligent 概論 棅易Business intelligent 概論 棅易
Business intelligent 概論 棅易Lawrence Huang
 
Report 106553012 - copy
Report 106553012 - copyReport 106553012 - copy
Report 106553012 - copyJacky Zou
 
逻辑数据编织 – 构建先进的现代企业数据架构
逻辑数据编织 – 构建先进的现代企业数据架构逻辑数据编织 – 构建先进的现代企业数据架构
逻辑数据编织 – 构建先进的现代企业数据架构Denodo
 

Similar to Introduction of libraries' big data in China (20)

淘宝数据可视化[2010 SD2.0]
淘宝数据可视化[2010 SD2.0]淘宝数据可视化[2010 SD2.0]
淘宝数据可视化[2010 SD2.0]
 
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
 
IT445_Week_11.pdf
IT445_Week_11.pdfIT445_Week_11.pdf
IT445_Week_11.pdf
 
當資料科學家不須花大量時間蒐集/清洗數據-2015 R Taiwan研討會分享
當資料科學家不須花大量時間蒐集/清洗數據-2015 R Taiwan研討會分享當資料科學家不須花大量時間蒐集/清洗數據-2015 R Taiwan研討會分享
當資料科學家不須花大量時間蒐集/清洗數據-2015 R Taiwan研討會分享
 
Npo与云计算
Npo与云计算Npo与云计算
Npo与云计算
 
Dltrendsatzjpolytech
DltrendsatzjpolytechDltrendsatzjpolytech
Dltrendsatzjpolytech
 
What is big data
What is big dataWhat is big data
What is big data
 
Big Data 101 一 一個充滿意圖與關聯世界的具體實現
Big Data 101 一 一個充滿意圖與關聯世界的具體實現Big Data 101 一 一個充滿意圖與關聯世界的具體實現
Big Data 101 一 一個充滿意圖與關聯世界的具體實現
 
Emc keynote 1130 1200
Emc keynote 1130 1200Emc keynote 1130 1200
Emc keynote 1130 1200
 
博晓通企业介绍和典型客户201504 (完整版)
博晓通企业介绍和典型客户201504 (完整版)博晓通企业介绍和典型客户201504 (完整版)
博晓通企业介绍和典型客户201504 (完整版)
 
N世代情報收集術
N世代情報收集術N世代情報收集術
N世代情報收集術
 
Realtime analytics with Flink and Druid
Realtime analytics with Flink and DruidRealtime analytics with Flink and Druid
Realtime analytics with Flink and Druid
 
查礼 -大数据技术如何用于传统信息系统
查礼 -大数据技术如何用于传统信息系统查礼 -大数据技术如何用于传统信息系统
查礼 -大数据技术如何用于传统信息系统
 
從統計到資料科學
從統計到資料科學從統計到資料科學
從統計到資料科學
 
Dtcc ibm big data platform 2012-final_cn
Dtcc ibm big data platform 2012-final_cnDtcc ibm big data platform 2012-final_cn
Dtcc ibm big data platform 2012-final_cn
 
Business intelligent 概論 棅易
Business intelligent 概論 棅易Business intelligent 概論 棅易
Business intelligent 概論 棅易
 
数据仓库
数据仓库数据仓库
数据仓库
 
Report 106553012 - copy
Report 106553012 - copyReport 106553012 - copy
Report 106553012 - copy
 
逻辑数据编织 – 构建先进的现代企业数据架构
逻辑数据编织 – 构建先进的现代企业数据架构逻辑数据编织 – 构建先进的现代企业数据架构
逻辑数据编织 – 构建先进的现代企业数据架构
 
Dmresearch
DmresearchDmresearch
Dmresearch
 

Recently uploaded

EDUC6506_ClassPresentation_TC330277 (1).pptx
EDUC6506_ClassPresentation_TC330277 (1).pptxEDUC6506_ClassPresentation_TC330277 (1).pptx
EDUC6506_ClassPresentation_TC330277 (1).pptxmekosin001123
 
布莱德福德大学毕业证制作/英国本科学历如何认证/购买一个假的香港中文大学专业进修学院硕士学位证书
布莱德福德大学毕业证制作/英国本科学历如何认证/购买一个假的香港中文大学专业进修学院硕士学位证书布莱德福德大学毕业证制作/英国本科学历如何认证/购买一个假的香港中文大学专业进修学院硕士学位证书
布莱德福德大学毕业证制作/英国本科学历如何认证/购买一个假的香港中文大学专业进修学院硕士学位证书kathrynalvarez364
 
中国文学, 了解王安石变法,熙宁变法,熙盛变法- 中国古代改革的类型- 富国强兵,
中国文学, 了解王安石变法,熙宁变法,熙盛变法- 中国古代改革的类型- 富国强兵,中国文学, 了解王安石变法,熙宁变法,熙盛变法- 中国古代改革的类型- 富国强兵,
中国文学, 了解王安石变法,熙宁变法,熙盛变法- 中国古代改革的类型- 富国强兵,Xin Yun Teo
 
澳洲圣母大学毕业证制作/加拿大硕士学历代办/购买一个假的中央警察大学硕士学位证书
澳洲圣母大学毕业证制作/加拿大硕士学历代办/购买一个假的中央警察大学硕士学位证书澳洲圣母大学毕业证制作/加拿大硕士学历代办/购买一个假的中央警察大学硕士学位证书
澳洲圣母大学毕业证制作/加拿大硕士学历代办/购买一个假的中央警察大学硕士学位证书kathrynalvarez364
 
1.🎉“入侵大学入学考试中心修改成绩”来袭!ALEVEL替考大揭秘,轻松搞定考试成绩! 💥你还在为无法进入大学招生系统而烦恼吗?想知道如何通过技术手段更改...
1.🎉“入侵大学入学考试中心修改成绩”来袭!ALEVEL替考大揭秘,轻松搞定考试成绩! 💥你还在为无法进入大学招生系统而烦恼吗?想知道如何通过技术手段更改...1.🎉“入侵大学入学考试中心修改成绩”来袭!ALEVEL替考大揭秘,轻松搞定考试成绩! 💥你还在为无法进入大学招生系统而烦恼吗?想知道如何通过技术手段更改...
1.🎉“入侵大学入学考试中心修改成绩”来袭!ALEVEL替考大揭秘,轻松搞定考试成绩! 💥你还在为无法进入大学招生系统而烦恼吗?想知道如何通过技术手段更改...黑客 接单【TG/微信qoqoqdqd】
 
日本九州齿科大学毕业证制作🚩定制本科卒业证书🚩哪里可以购买假美国西南基督复临安息日会大学成绩单
日本九州齿科大学毕业证制作🚩定制本科卒业证书🚩哪里可以购买假美国西南基督复临安息日会大学成绩单日本九州齿科大学毕业证制作🚩定制本科卒业证书🚩哪里可以购买假美国西南基督复临安息日会大学成绩单
日本九州齿科大学毕业证制作🚩定制本科卒业证书🚩哪里可以购买假美国西南基督复临安息日会大学成绩单jakepaige317
 
EDUC6506(001)_ClassPresentation_2_TC330277 (1).pptx
EDUC6506(001)_ClassPresentation_2_TC330277 (1).pptxEDUC6506(001)_ClassPresentation_2_TC330277 (1).pptx
EDUC6506(001)_ClassPresentation_2_TC330277 (1).pptxmekosin001123
 
哪里可以购买日本筑波学院大学学位记/做个假的文凭可认证吗/仿制日本大学毕业证/意大利语CELI证书定制
哪里可以购买日本筑波学院大学学位记/做个假的文凭可认证吗/仿制日本大学毕业证/意大利语CELI证书定制哪里可以购买日本筑波学院大学学位记/做个假的文凭可认证吗/仿制日本大学毕业证/意大利语CELI证书定制
哪里可以购买日本筑波学院大学学位记/做个假的文凭可认证吗/仿制日本大学毕业证/意大利语CELI证书定制jakepaige317
 
educ6506presentationtc3302771-240427173057-06a46de5.pptx
educ6506presentationtc3302771-240427173057-06a46de5.pptxeduc6506presentationtc3302771-240427173057-06a46de5.pptx
educ6506presentationtc3302771-240427173057-06a46de5.pptxmekosin001123
 
哪里可以购买日本神奈川县立保健福祉大学学位记/录取通知书可以制作吗/补办马来西亚大学文凭/CIA证书定制
哪里可以购买日本神奈川县立保健福祉大学学位记/录取通知书可以制作吗/补办马来西亚大学文凭/CIA证书定制哪里可以购买日本神奈川县立保健福祉大学学位记/录取通知书可以制作吗/补办马来西亚大学文凭/CIA证书定制
哪里可以购买日本神奈川县立保健福祉大学学位记/录取通知书可以制作吗/补办马来西亚大学文凭/CIA证书定制kathrynalvarez364
 
日本姫路独协大学毕业证制作/修士学位记多少钱/哪里可以购买假美国圣何塞州立大学成绩单
日本姫路独协大学毕业证制作/修士学位记多少钱/哪里可以购买假美国圣何塞州立大学成绩单日本姫路独协大学毕业证制作/修士学位记多少钱/哪里可以购买假美国圣何塞州立大学成绩单
日本姫路独协大学毕业证制作/修士学位记多少钱/哪里可以购买假美国圣何塞州立大学成绩单kathrynalvarez364
 

Recently uploaded (11)

EDUC6506_ClassPresentation_TC330277 (1).pptx
EDUC6506_ClassPresentation_TC330277 (1).pptxEDUC6506_ClassPresentation_TC330277 (1).pptx
EDUC6506_ClassPresentation_TC330277 (1).pptx
 
布莱德福德大学毕业证制作/英国本科学历如何认证/购买一个假的香港中文大学专业进修学院硕士学位证书
布莱德福德大学毕业证制作/英国本科学历如何认证/购买一个假的香港中文大学专业进修学院硕士学位证书布莱德福德大学毕业证制作/英国本科学历如何认证/购买一个假的香港中文大学专业进修学院硕士学位证书
布莱德福德大学毕业证制作/英国本科学历如何认证/购买一个假的香港中文大学专业进修学院硕士学位证书
 
中国文学, 了解王安石变法,熙宁变法,熙盛变法- 中国古代改革的类型- 富国强兵,
中国文学, 了解王安石变法,熙宁变法,熙盛变法- 中国古代改革的类型- 富国强兵,中国文学, 了解王安石变法,熙宁变法,熙盛变法- 中国古代改革的类型- 富国强兵,
中国文学, 了解王安石变法,熙宁变法,熙盛变法- 中国古代改革的类型- 富国强兵,
 
澳洲圣母大学毕业证制作/加拿大硕士学历代办/购买一个假的中央警察大学硕士学位证书
澳洲圣母大学毕业证制作/加拿大硕士学历代办/购买一个假的中央警察大学硕士学位证书澳洲圣母大学毕业证制作/加拿大硕士学历代办/购买一个假的中央警察大学硕士学位证书
澳洲圣母大学毕业证制作/加拿大硕士学历代办/购买一个假的中央警察大学硕士学位证书
 
1.🎉“入侵大学入学考试中心修改成绩”来袭!ALEVEL替考大揭秘,轻松搞定考试成绩! 💥你还在为无法进入大学招生系统而烦恼吗?想知道如何通过技术手段更改...
1.🎉“入侵大学入学考试中心修改成绩”来袭!ALEVEL替考大揭秘,轻松搞定考试成绩! 💥你还在为无法进入大学招生系统而烦恼吗?想知道如何通过技术手段更改...1.🎉“入侵大学入学考试中心修改成绩”来袭!ALEVEL替考大揭秘,轻松搞定考试成绩! 💥你还在为无法进入大学招生系统而烦恼吗?想知道如何通过技术手段更改...
1.🎉“入侵大学入学考试中心修改成绩”来袭!ALEVEL替考大揭秘,轻松搞定考试成绩! 💥你还在为无法进入大学招生系统而烦恼吗?想知道如何通过技术手段更改...
 
日本九州齿科大学毕业证制作🚩定制本科卒业证书🚩哪里可以购买假美国西南基督复临安息日会大学成绩单
日本九州齿科大学毕业证制作🚩定制本科卒业证书🚩哪里可以购买假美国西南基督复临安息日会大学成绩单日本九州齿科大学毕业证制作🚩定制本科卒业证书🚩哪里可以购买假美国西南基督复临安息日会大学成绩单
日本九州齿科大学毕业证制作🚩定制本科卒业证书🚩哪里可以购买假美国西南基督复临安息日会大学成绩单
 
EDUC6506(001)_ClassPresentation_2_TC330277 (1).pptx
EDUC6506(001)_ClassPresentation_2_TC330277 (1).pptxEDUC6506(001)_ClassPresentation_2_TC330277 (1).pptx
EDUC6506(001)_ClassPresentation_2_TC330277 (1).pptx
 
哪里可以购买日本筑波学院大学学位记/做个假的文凭可认证吗/仿制日本大学毕业证/意大利语CELI证书定制
哪里可以购买日本筑波学院大学学位记/做个假的文凭可认证吗/仿制日本大学毕业证/意大利语CELI证书定制哪里可以购买日本筑波学院大学学位记/做个假的文凭可认证吗/仿制日本大学毕业证/意大利语CELI证书定制
哪里可以购买日本筑波学院大学学位记/做个假的文凭可认证吗/仿制日本大学毕业证/意大利语CELI证书定制
 
educ6506presentationtc3302771-240427173057-06a46de5.pptx
educ6506presentationtc3302771-240427173057-06a46de5.pptxeduc6506presentationtc3302771-240427173057-06a46de5.pptx
educ6506presentationtc3302771-240427173057-06a46de5.pptx
 
哪里可以购买日本神奈川县立保健福祉大学学位记/录取通知书可以制作吗/补办马来西亚大学文凭/CIA证书定制
哪里可以购买日本神奈川县立保健福祉大学学位记/录取通知书可以制作吗/补办马来西亚大学文凭/CIA证书定制哪里可以购买日本神奈川县立保健福祉大学学位记/录取通知书可以制作吗/补办马来西亚大学文凭/CIA证书定制
哪里可以购买日本神奈川县立保健福祉大学学位记/录取通知书可以制作吗/补办马来西亚大学文凭/CIA证书定制
 
日本姫路独协大学毕业证制作/修士学位记多少钱/哪里可以购买假美国圣何塞州立大学成绩单
日本姫路独协大学毕业证制作/修士学位记多少钱/哪里可以购买假美国圣何塞州立大学成绩单日本姫路独协大学毕业证制作/修士学位记多少钱/哪里可以购买假美国圣何塞州立大学成绩单
日本姫路独协大学毕业证制作/修士学位记多少钱/哪里可以购买假美国圣何塞州立大学成绩单
 

Introduction of libraries' big data in China

Editor's Notes

  1. Value一指价值高,一指价值密度低 “大量化(Volume)、多样化(Variety)、快速化(Velocity)、价值密度低(Value)”就是“大数据”的显著特征,或者说,只有具备这些特点的数据,才是大数据。
  2. 是技术、社会发展的必然结果。 设备:存储、感知、 互联网:尤其是移动互联网 需求:进一步计算
  3. 网上1分钟,人间1万年。 微信每天发送消息次数达到380亿次,语音达到61亿次。
  4. 规约:发现有用特征,缩减数据规模 Hadoop作为一个开源的框架,专为离线和大规模数据分析而设计,HDFS作为其核心的存储引擎,已被广泛用于数据存储。大数据其实源自于2005年hadoop项目诞生 MapReduce作为Hadoop的查询引擎,用于大规模数据集的并行计算,”Map(映射)”和”Reduce(归约)”,是它的主要思想。它极大的方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统中。 Spark拥有Hadoop MapReduce所具有的特点,内存计算,从而不需要读取HDFS。 搜索引擎:Solr、Elasticsearch… 分类:根据数据集的特点把未知类别的样本映射到给定类别中,例如朴素贝叶斯算法、支持向量机SVM算法 聚类:数据集内具有相似特征属性的数据聚集在一起,如期望最大化算法(EM算法)、K近邻算法 关联规则:找出能把一组数据项与另一组数据项联系起来的规则,以获得未知的、不能通过逻辑操作或统计得出的信息 预测模型:可以在结构化与非结构化数据中使用以确定未来结果的算法和技术。 可视化技术可以使结果更直观以便于洞察,有助于大数据的分析挖掘和结果呈现。
  5. 趋势: 大数据 + 人工智能 = 全新技术栈 数据正在陆续上云,打响云端战役,数据正在虚拟化 基础架构:流处理的重要性与日俱增,目前Spark已独占鳌头 SQL已经正式回归,Google BigQuery、SparkSQL、
  6. 基于大量数据进行统计的,是片面客观的,从而得出结果的。 这种方法是以前无法实现的
  7. 北师大 http://www.sohu.com/a/217525497_391342
  8. 阅读排行榜——借阅账单——年度报告——
  9. 资源:馆藏、空间 用户:用户、读者 服务:借阅、服务
  10. 图书馆讲大数据不仅仅是“大”
  11. 馆藏资源、空间资源、设施设备资源 用户特征、用户行为、用户互联网数据 服务过程中产生的日志、交互等数据
  12. 流通日志、服务器日志、设备日志 反馈、留言、交流、电话、频次 服务参与覆盖面、参与频次、影响因素分析 微信等社交媒体、关键字等
  13. 引自刘炜keven报告《阅读推广与大数据》
  14. 资源下架:流通日志、检索日志、出版社权值、年份权值、学科权值、其他馆流通日志等 找最相似读者
  15. 我们不再需要关注具体的设备需求,而仅需提出服务需求,入门门槛降低,并且,按需购买、成本降低。 到目前为止,中文的纸质图书、期刊、学位论文等文献类型,已大部完成数字化转换。报纸、灰色文献正在进行数字化转换。 图书馆对于文献数据库以外的数字资源的采集、处理、保存、挖掘和服务,还没有引起足够的重视。 各类数字资源在爆炸式增长,尤其是非结构化的数据(图片、声音、视频、地理位置信息等等),已经成为信息资源的主体。这是当前资源数字化的新特征。
  16. 当你的安卓手机 Wi-Fi 处于打开状态时,会与周围的 Wi-Fi 热点握手,若干热点可以根据你的信号强度反算出你的位置,并与你的 MAC 地址相关联,精准度可达米级。苹果手机如果你打开了蓝牙,也可以实现类似的定位。通过买来的数据将 MAC 与设备号映射起来,手机上的应用就能在你走下扶梯的一刻作出反应了。 即使没有姓名、电话这些个人可定位信息,对目标用户有一定背景信息了解的熟人,也通过互联网稀疏行为数据对应到个人从而获取更多隐私。新兴的“差分隐私”技术,也是为了克服这一难题。 根据个性化数据进行的推荐,百度搜索的推送、头条的内涵段子等
  17. 一、理性、客观、积极的态度
  18. 大数据是一种数据分析方式,与传统数据分析方式有着本质上的不同,如何对待数据: 更多:全面数据比抽样数据更准确。 更杂:增加数据的维度 关联:关注相关性,不关注因果,不深究为什么,而关注是什么,与什么相关。 数据的价值并不与数据规模直接相关,一家机构是否可以从数据中获取有效洞察取决于这家机构对数据的重视程度