Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
4. 컨텐츠에서지능 정보 추출하기
4.1 컨텐츠 종류와 이들의 통합형태별로 컨텐츠를 분류, 추상화해서 인프라 구축지구 온난화 관심사용자에게 관련 컨텐츠 제공하는 프로세스 분류.뉴스 기사, 블로그, 게시판, 채팅, 동영상...컨텐츠 collection에서...
4.1.2 컨텐츠를 통합하기       위한 아키텍처내부에서 개별 인스턴스가호스팅되는 형태애플리케이션에 통합된 형태외부에서 제공하는 형태
4.2 집단지성 관련 컨텐츠블로그위키그룹과 게시판
4.3 단계적 지능 정보 추출토큰화 - 텍스트 파싱, 텀 추출.정규화 - 텀을 소문자로 변환.불용어 제거 - 흔한 용어 제거.스테밍 - 텀에서 어근 추출. 복수형 -> 단수형.
4.3.1 예제 셋업웹 2.0과 집단 지성 관련 글user, users 단어가 자주 나옴제목은 컨텐츠에 중요한 정보를 제공
MetaDataVector를 통해 시각화.
제목과 본문으로 MetaDataVector를 생성.
텍스트에서 텀 추출불용어 제거어근, 복수형 단어 처리다수의 텀으로 구성된 구(Phrase) 추출
4.3.3 불용어 처리
4.3.4 스테밍
4.3.5 구(PHRASE) 인식
4.4 단순/복합 컨텐츠 타입단순 컨텐츠 - 글, 사진, 동영상, 블로그, 투표, 제품.복합 컨텐츠 - 질문과 답변, 트윗...
Ciia ch4
Ciia ch4
Ciia ch4
Ciia ch4
Ciia ch4
Ciia ch4
Ciia ch4
Upcoming SlideShare
Loading in …5
×

Ciia ch4

747 views

Published on

Published in: Technology
  • Be the first to comment

  • Be the first to like this

Ciia ch4

  1. 1. 4. 컨텐츠에서지능 정보 추출하기
  2. 2. 4.1 컨텐츠 종류와 이들의 통합형태별로 컨텐츠를 분류, 추상화해서 인프라 구축지구 온난화 관심사용자에게 관련 컨텐츠 제공하는 프로세스 분류.뉴스 기사, 블로그, 게시판, 채팅, 동영상...컨텐츠 collection에서 키워드를 뽑아내는 방법.
  3. 3. 4.1.2 컨텐츠를 통합하기 위한 아키텍처내부에서 개별 인스턴스가호스팅되는 형태애플리케이션에 통합된 형태외부에서 제공하는 형태
  4. 4. 4.2 집단지성 관련 컨텐츠블로그위키그룹과 게시판
  5. 5. 4.3 단계적 지능 정보 추출토큰화 - 텍스트 파싱, 텀 추출.정규화 - 텀을 소문자로 변환.불용어 제거 - 흔한 용어 제거.스테밍 - 텀에서 어근 추출. 복수형 -> 단수형.
  6. 6. 4.3.1 예제 셋업웹 2.0과 집단 지성 관련 글user, users 단어가 자주 나옴제목은 컨텐츠에 중요한 정보를 제공
  7. 7. MetaDataVector를 통해 시각화.
  8. 8. 제목과 본문으로 MetaDataVector를 생성.
  9. 9. 텍스트에서 텀 추출불용어 제거어근, 복수형 단어 처리다수의 텀으로 구성된 구(Phrase) 추출
  10. 10. 4.3.3 불용어 처리
  11. 11. 4.3.4 스테밍
  12. 12. 4.3.5 구(PHRASE) 인식
  13. 13. 4.4 단순/복합 컨텐츠 타입단순 컨텐츠 - 글, 사진, 동영상, 블로그, 투표, 제품.복합 컨텐츠 - 질문과 답변, 트윗...

×