Apache+ q logs
Upcoming SlideShare
Loading in...5
×
 

Apache+ q logs

on

  • 695 views

 

Statistics

Views

Total Views
695
Views on SlideShare
695
Embed Views
0

Actions

Likes
0
Downloads
3
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment
  • 02/28/11
  • 02/28/11
  • 02/28/11
  • 02/28/11
  • 02/28/11
  • 02/28/11
  • 02/28/11
  • 02/28/11
  • 02/28/11
  • 02/28/11
  • 02/28/11
  • 02/28/11

Apache+ q logs Apache+ q logs Presentation Transcript

  • Demo: Kết hợp Apache - JRE - Nutch vào Eclipse. Tạo và lưu câu truy vấn vào QLogs.
    • Kết hợp Apache - JRE - Nutch vào Eclipse
    • 1, Phiên bản Eclipse
    • 2. Kết hợp Webserver, JRE vào Workspace.
    • 3. Import Nutch.
    • 4. Đặc tả CrawlDB
    • B. Tạo QLogs và lưu câu truy vấn
    • 1. CSDL
    • 2. Import thư viện JDBC vào Eclipse
    • 3. Lưu câu truy vấn
  • A. Kết hợp Apache - JRE - Nutch vào Eclipse 1, Phiên bản Eclipse thực nghiệm: Eclipse EUROPA download tại: http://www.eclipse.org/downloads/moreinfo/jee.php
  • A. Kết hợp Apache - JRE - Nutch vào Eclipse 2. Kết hợp Webserver Apache, JRE vào Workspace: Kết hợp Webserver: Vào menu Window. Preferences. Server. Installed Runtimes. Nhấn nút Add để add Webserver (Apache Tomcat).
  • A. Kết hợp Apache - JRE - Nutch vào Eclipse 2. Kết hợp Webserver Apache, JRE vào Workspace: Kết hợp JRE: Nhấn button Next, chọn môi trường thực thi JRE (Java Runtime Environment)
  • A. Kết hợp Apache - JRE - Nutch vào Eclipse 3. Import Nutch vào Workspace: Trên vùng Project Explorer, nhấn phải chọn Import. Web. WAR file để import Nutch vào Workspace.
  • A. Kết hợp Apache - JRE - Nutch vào Eclipse 4. Đặc tả CrawlDB để thực hiện tìm kiếm: Trên vùng Project Explorer, từ thư mục Nutch vừa được triển khai trên, chọn built. classess, mở file nutch-site.xml, đặc tả thuộc tính value cho CrawlDB:
  • A. Kết hợp Apache - JRE - Nutch vào Eclipse
    • trang search.jsp sử dụng phương thức GET để get data nằm trong URL string,
    • Webserver không nhận biết được encoding của câu lệnh request.setCharacterEncoding("UTF-8") mà sử dụng default encoding ISO-8859-1,
    • Đây là nguyên nhân khiến JSP form không phân giải được mã tiếng Việt UTF-8.
    • Trên vùng Project Explorer, từ thư mục Webserver vừa được kết hợp trên, mở file server.xml để thêm encoding nhận dạng URI (Uniform Resource Identifier):
    • <Connector URIEncoding=&quot;UTF-8&quot; connectionTimeout=&quot;20000&quot; port=&quot;8080&quot; ... >
    • - Running với F11.
  • A. Kết hợp Apache - JRE - Nutch vào Eclipse Debug: Đặt điểm break point và sử dụng các phím chức năng như F5 (Step Into), F6 (Step Over), F7 (Step Return) để thực hiện debug.
  • B. Tạo Qlogs và lưu câu truy vấn
    • CSDL để lưu các câu truy vấn: MS. SQL Server
    • Import lớp thư viện JDBC vào Eclipse
    • Bước 1. Download tại:
    • http://www.sourceforge.net/projects/jtds/develop
    • Bước 2. Copy file jtds - 1.2.5 . jar vào Workspace để build vào thư viện của Eclipse.
    • B3. Trên vùng Project Explorer, từ thư mục Nutch vừa được triển khai trên, nhấn phải chọn Properties. Java Build Path. Chọn tab Libraries. Click button Add External JARs để add file *.jar vừa copy trên. Sang tab Order and Export để click chọn thư viện này.
  • B. Tạo Qlogs và lưu câu truy vấn Import lớp thư viện JDBC vào Eclipse (cont) Lưu câu truy vấn (search.jsp): Mặc định, Nutch lưu câu truy vấn của người dùng vào biến queryString. Nhằm thực hiện QLogs, nhóm Gợi ý truy vấn đề nghị sử dụng DBMS để lưu các câu truy vấn. Có thể sử dụng 1 đoạn mã lập trình nhỏ để lấy nội dung biến queryString và lưu vào QLogs.
  • B. Tạo Qlogs và lưu câu truy vấn Lưu câu truy vấn (cont)
  • B. Tạo Qlogs và lưu câu truy vấn
    • Các hàm chức năng:
    • - Hàm lấy thời gian: <%=date.toGMTString()%>
    • - Hàm lấy IP: request.getRemoteAddr()
    • Hàm lấy Session:
    • HttpSession session = request.getSession();
    • String id = session.getId();
    • Hàm lấy Cookies:
        • Cookie cookie = new Cookie (&quot;tên&quot;,giá trị);
        • Cookie.setMaxAge(365 * 24 * 60 * 60);
    • response.addCookie(cookie);
        • Cookie cookies [] = request.getCookies ()
        • Cookies[i].getValue()
    • - Hàm lấy URL clicked: ?