웹보메트릭스와 계량정보학
2주차 계량정보학적 관점이란?
1강. 계량정보학의 이해
2강. 오픈데이터의 현황 및 시사점

영남대학교 문과대학 언론정보학과
교수 박한우
1. 계량정보학이 무엇인지 이해한다.

1. 계량정보학이란?
2. 계량정보학의 학문적 위치
3. 계량정보학의 연구 방법
4. 계량정보학의 연구 영역
1. 계량정보학이란?

계량정보학

Nacke(1979)에 의해 용어가 처음 사용됨.
Bonitz(1982)의 논문에서도 언급함.

구 소련의 VINITI(All-Union Institute and Technical I...
1. 계량정보학이란?
계량정보학의 정의

“

측정(measurement), 정보현상에 관한 제변수간의 수리모형화,
그리고 정보의 축적과 검색을 다루는 학문이다.

”

- Egghe & Rousseau(1990) -
...
1. 계량정보학이란?
계량정보학
계량서지학과 계량과학학의 양자가 가리키는 분야를
공정하게 포괄, 그 연구대상에는 도서는 물론 비도서와
컴퓨터 등에 소장된 전자 정보까지 함축적으로 포함.
2. 계량정보학의 학문적 위치

계량정보학

Informetrics(계량정보학)
측정을 의미
계량정보학은 계량제변수간의 관계를 실증적으로 측정
하고 검정.
2. 계량정보학의 학문적 위치
기초과학
수학
-운영연구(OR)
-통계학
-확률이론
-이산수학
-수리분석
-수리정보이론
물리학
컴퓨터과학

계량정보학
계량정보학
-계량서지학
-계량과학학
-정보검색의 이론적 측면

<계량정...
2. 계량정보학의 학문적 위치

계량정보학
수학, 물리학, 컴퓨터과학 등에서 도구(기법,
모형, 유추)들을 빌려옴.

계량정보학의 연구결과
도서관경영, 커뮤니케이션, 과학사회학, 과
학정책 및 정보 검색에 응용됨.
3. 계량정보학의 연구방법

계량정보연구의 두 가지 요소

이론

사실
결합

이 두 요소를 결합하는 것이 계량정보학의 주된 관심임.
3. 계량정보학의 연구방법
<계량정보연구의 두 가지 요소>

이론
• 계량정보학의 목적을 수행할 수
있도록 개발되어야 함.
• 이론의 가장 보편적 형태는
모형, 특히 계량모형(informetric
models).
• 모...
3. 계량정보학의 연구방법

계량연구 진행의 절차

1

이론을 계량모형의 형태로 개발함

2

사실들을 자료화함.

3

이 두 요소를 결합함.

4

조정된 자료를 이용하여 계량모형을 추정하는 마지막 단계에서는
일련...
3. 계량정보학의 연구방법

구조분석

정보관계를 수량적으로 측정하고 검정하며 또
타당성을 부여함으로써 실제 정보현상을 파악하려는
것.

정책평가

추정된 계량모형을 이용하여 대안적인 여러 도서관
또는 정보시스템의 정책...
3. 계량정보학의 연구방법
<계량접근방법>
이론

사실

모형

자료

수학 및 통계학

계량모형

조정된 자료

계량기법

조정된 자료이용 계량모형 추정

구조분석

예측

정책평가
4. 계량정보학의 연구영역
가. 통계학
• 표집, 테스팅, 상관계수와 회귀분석, 다변량분석 등의 통계적 기법을
다루는 연구들의 몇가지 경우를 제외하고는 대부분 기술에 속함.
• 통계는 계량정보학의 기원을 이룸.
나. 운...
4. 계량정보학의 연구영역

Zipf법칙
지프의 법칙에 따르면 어떠한 자연어 말뭉치 표현에
나타나는 단어들을 그 사용 빈도가 높은 순서대로
나열하였을 때, 모든 단어의 사용 빈도는 해당 단어의
순위에 반비례한다. 따라서...
4. 계량정보학의 연구영역

Zipf의 법칙 활용
순위 * 출현 빈도 = 상수
가장 흔히 등장하는 20%의 단어들이 문헌 전체 용어의 70%를 구성
고빈도

이 부분은 문서에
너무 많이
등장하기 때문에
문서들을
구분하고...
4. 계량정보학의 연구영역
라. 인용분석
• 인용 파라미터, 네트워크 과학정책 등이 있음.
• 이 분야 기본적인 연구들은 Small 등에 의해서 이루어졌음에도 불구하고 기술(특히
다변량분석)로 확장.
• 서지결합법과 동...
4. 계량정보학의 연구영역
바. 정보이론
• Shannon-Weaver의 정보이론으로 이 분야는 분명히 이론에 속함.
• 실제, 정보이론은 수학의 일부분

사. 정보검색의 이론적 측면
• 평가기법, 퍼지 혹은 확률시스템...
QUIZ.
계량정보학은 ( 계량서지학 계량과학학의 양자가 가리키는 분야를
)과
공정하게 포괄, 그 연구대상에는 도서는 물론 비도서와 컴퓨터 등에
소장된 전자 정보까지 함축적으로 포함하고 있다.
정리하기.
 계량정보학은 계량서지학과 계량과학학의 양자가 가리키는 분야를
공정하게 포괄, 그 연구대상에는 도서는 물론 비도서와 컴퓨터 등에
소장된 전자 정보까지 함축적으로 포함하고 있다.
 계량정보학은 수학, 물리학...
차시예고.

2주 2차시 오픈데이터의 현황 및 시사점
Upcoming SlideShare
Loading in …5
×

웹보메트릭스와 계량정보학02 1

842 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
842
On SlideShare
0
From Embeds
0
Number of Embeds
6
Actions
Shares
0
Downloads
1
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

웹보메트릭스와 계량정보학02 1

  1. 1. 웹보메트릭스와 계량정보학 2주차 계량정보학적 관점이란? 1강. 계량정보학의 이해 2강. 오픈데이터의 현황 및 시사점 영남대학교 문과대학 언론정보학과 교수 박한우
  2. 2. 1. 계량정보학이 무엇인지 이해한다. 1. 계량정보학이란? 2. 계량정보학의 학문적 위치 3. 계량정보학의 연구 방법 4. 계량정보학의 연구 영역
  3. 3. 1. 계량정보학이란? 계량정보학 Nacke(1979)에 의해 용어가 처음 사용됨. Bonitz(1982)의 논문에서도 언급함. 구 소련의 VINITI(All-Union Institute and Technical Information) 계량서지학과 계량과학학을 포함하는 포괄적인 용어로 채택함. (Gorkova, 1988 ; Brookes, 1990)
  4. 4. 1. 계량정보학이란? 계량정보학의 정의 “ 측정(measurement), 정보현상에 관한 제변수간의 수리모형화, 그리고 정보의 축적과 검색을 다루는 학문이다. ” - Egghe & Rousseau(1990) - 계량정보학의 선행용어 계량서지학의 정의 “ 도서와 다른 커뮤니케이션 미디어에 수학 및 통계방법을 적용하는 학문이다. ” - Hulme(1923) -
  5. 5. 1. 계량정보학이란? 계량정보학 계량서지학과 계량과학학의 양자가 가리키는 분야를 공정하게 포괄, 그 연구대상에는 도서는 물론 비도서와 컴퓨터 등에 소장된 전자 정보까지 함축적으로 포함.
  6. 6. 2. 계량정보학의 학문적 위치 계량정보학 Informetrics(계량정보학) 측정을 의미 계량정보학은 계량제변수간의 관계를 실증적으로 측정 하고 검정.
  7. 7. 2. 계량정보학의 학문적 위치 기초과학 수학 -운영연구(OR) -통계학 -확률이론 -이산수학 -수리분석 -수리정보이론 물리학 컴퓨터과학 계량정보학 계량정보학 -계량서지학 -계량과학학 -정보검색의 이론적 측면 <계량정보학의 학문적 위치> 계량과학 계량생물학 계량경제학 계량화학 계량사회학 계량언어학 응용영역 도서관경영 커뮤니케이션(학술,정치,…) 과학사회학 과학사 과학정책 정보검색 Egghe & Rousseau(1990)을 재구성
  8. 8. 2. 계량정보학의 학문적 위치 계량정보학 수학, 물리학, 컴퓨터과학 등에서 도구(기법, 모형, 유추)들을 빌려옴. 계량정보학의 연구결과 도서관경영, 커뮤니케이션, 과학사회학, 과 학정책 및 정보 검색에 응용됨.
  9. 9. 3. 계량정보학의 연구방법 계량정보연구의 두 가지 요소 이론 사실 결합 이 두 요소를 결합하는 것이 계량정보학의 주된 관심임.
  10. 10. 3. 계량정보학의 연구방법 <계량정보연구의 두 가지 요소> 이론 • 계량정보학의 목적을 수행할 수 있도록 개발되어야 함. • 이론의 가장 보편적 형태는 모형, 특히 계량모형(informetric models). • 모형이란 고려하고 있는 정보 관계들에 적합한 이론들을 요약한 것이며 이는 실증적 추정 및 검정을 위하여 관련된 이론을 요약하는 가장 편리한 방법. 사실 • 실제 세계의 사건을 가리킴. • 계량정보연구에서 이러한 사실들을 적절히 반영하는 일련의 자료들을 구하는 것이 필수. • 자료들을 원래의 형태로 사용하는 경우도 있지만 연구 목적에 적합하도록 다듬거나 조정하는 것이 일반적.
  11. 11. 3. 계량정보학의 연구방법 계량연구 진행의 절차 1 이론을 계량모형의 형태로 개발함 2 사실들을 자료화함. 3 이 두 요소를 결합함. 4 조정된 자료를 이용하여 계량모형을 추정하는 마지막 단계에서는 일련의 계량기법들을 사용함. 결과 모수의 추정치들로 이루어진 추정된 계량모형으로서, 이 계량모형을 이용하여 „구조분석‟, „예측‟, 그리고 „정책수립 또는 평가‟를 할 수 있음
  12. 12. 3. 계량정보학의 연구방법 구조분석 정보관계를 수량적으로 측정하고 검정하며 또 타당성을 부여함으로써 실제 정보현상을 파악하려는 것. 정책평가 추정된 계량모형을 이용하여 대안적인 여러 도서관 또는 정보시스템의 정책들을 비교하여 선택하는 것 예측 추정된 계량모형을 이용하여 정보변수가 취하는 미래의 값들을 구하는 절차를 말하며 예측은 정책수립을 위해서 매우 중요
  13. 13. 3. 계량정보학의 연구방법 <계량접근방법> 이론 사실 모형 자료 수학 및 통계학 계량모형 조정된 자료 계량기법 조정된 자료이용 계량모형 추정 구조분석 예측 정책평가
  14. 14. 4. 계량정보학의 연구영역 가. 통계학 • 표집, 테스팅, 상관계수와 회귀분석, 다변량분석 등의 통계적 기법을 다루는 연구들의 몇가지 경우를 제외하고는 대부분 기술에 속함. • 통계는 계량정보학의 기원을 이룸. 나. 운영연구(OR) • 이 분야는 이론에 속하며 수리계획법, 대기행렬이론, 네트워크모형, 마코브체인 등의 운영연구모형들을 제공 다. 계량정보법칙 • 계량정보법칙에는 Zipf법칙, Lotka법칙, Bradford법칙 등이 있음. • 이 분야는 기술에서부터 이론까지 빠른 변형안에 있는 광범위한 토픽의 전형적인 예.
  15. 15. 4. 계량정보학의 연구영역 Zipf법칙 지프의 법칙에 따르면 어떠한 자연어 말뭉치 표현에 나타나는 단어들을 그 사용 빈도가 높은 순서대로 나열하였을 때, 모든 단어의 사용 빈도는 해당 단어의 순위에 반비례한다. 따라서 가장 사용 빈도가 높은 단어는 두 번째 단어보다 빈도가 약 두 배 높으며, 세 번째 단어보다는 빈도가 세 배 높다. 예를 들어, 브라운 대학교 현대 미국 영어 표준 말뭉치의 경우, 가장 사용 빈도가 높은 단어는 영어 정관사 “the”이며 전체 문서에서 7%의 빈도(약 백만 개 남짓의 전체 사용 단어 중 69,971회)를 차지한다. 두 번째로 사용 빈도가 높은 단어는 “of”로 약 3.5% 남짓(36,411회)한 빈도를 차지하며, 세 번째로 사용 빈도가 높은 단어는 “and”(28,852회)로, 지프의 법칙에 정확히 들어 맞는다. 약 135개 항목의 어휘만으로 브라운 대학 말뭉치의 절반을 나타낼 수 있다. http://ko.wikipedia.org/wiki/%EC%A7%80%ED%94%84%EC%9D%98_%EB%B2%95%EC%B9% 99
  16. 16. 4. 계량정보학의 연구영역 Zipf의 법칙 활용 순위 * 출현 빈도 = 상수 가장 흔히 등장하는 20%의 단어들이 문헌 전체 용어의 70%를 구성 고빈도 이 부분은 문서에 너무 많이 등장하기 때문에 문서들을 구분하고 대표하는 데 별 의미가 없음 중빈도 저빈도 쓰이는 횟수가 매우 드문 희귀한 단어들 역시 일반적인 문서 구분에는 도움이 안됨
  17. 17. 4. 계량정보학의 연구영역 라. 인용분석 • 인용 파라미터, 네트워크 과학정책 등이 있음. • 이 분야 기본적인 연구들은 Small 등에 의해서 이루어졌음에도 불구하고 기술(특히 다변량분석)로 확장. • 서지결합법과 동시인용법과 같은 유용한 토픽들은 아직은 이론으로 분류되어질 수 없음. • 그러나 인용분석은 많은 응용영역들을 갖고 있기 때문에 매우 중요한 하위 주제분야. 마. 대출이론 • 계량정보이론들이 운영연구의 제모형들과 결합되는 경우가 여기에 해당. • 이용은 운영연구모형들로 이루어지나 이 모형들이 계량정보학적 방법으로 확장됨. • 예를 들면, 운영연구모형인 마코브체인에 기초한 도서 이용에 대한 Morse모형 등이 있음. • Burrell 등은 운영연구모형을 이용하는 대신 대출과정에 적용할 수 있는 수수계량정보모형을 개발.
  18. 18. 4. 계량정보학의 연구영역 바. 정보이론 • Shannon-Weaver의 정보이론으로 이 분야는 분명히 이론에 속함. • 실제, 정보이론은 수학의 일부분 사. 정보검색의 이론적 측면 • 평가기법, 퍼지 혹은 확률시스템, 자동색인 및 디소러스구성, 코딩이론 등이 있음.
  19. 19. QUIZ. 계량정보학은 ( 계량서지학 계량과학학의 양자가 가리키는 분야를 )과 공정하게 포괄, 그 연구대상에는 도서는 물론 비도서와 컴퓨터 등에 소장된 전자 정보까지 함축적으로 포함하고 있다.
  20. 20. 정리하기.  계량정보학은 계량서지학과 계량과학학의 양자가 가리키는 분야를 공정하게 포괄, 그 연구대상에는 도서는 물론 비도서와 컴퓨터 등에 소장된 전자 정보까지 함축적으로 포함하고 있다.  계량정보학은 수학, 물리학, 컴퓨터과학등에서 도구(기법, 모형, 유추)들을 빌려왔으며 계량정보학의 연구결과는 도서관경영, 커뮤니케이션, 과학사회학, 과학정책 및 정보 검색에 응용된다.  계량정보학의 연구영역으로 통계학, 운영연구(OR), 인용분석, 정보이론 등 많은 분야에서 활용되고 있다.
  21. 21. 차시예고. 2주 2차시 오픈데이터의 현황 및 시사점

×