Apache+ q logs

  • 478 views
Uploaded on

 

More in: Technology
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
    Be the first to like this
No Downloads

Views

Total Views
478
On Slideshare
0
From Embeds
0
Number of Embeds
0

Actions

Shares
Downloads
4
Comments
0
Likes
0

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide
  • 02/28/11
  • 02/28/11
  • 02/28/11
  • 02/28/11
  • 02/28/11
  • 02/28/11
  • 02/28/11
  • 02/28/11
  • 02/28/11
  • 02/28/11
  • 02/28/11
  • 02/28/11

Transcript

  • 1. Demo: Kết hợp Apache - JRE - Nutch vào Eclipse. Tạo và lưu câu truy vấn vào QLogs.
    • Kết hợp Apache - JRE - Nutch vào Eclipse
    • 1, Phiên bản Eclipse
    • 2. Kết hợp Webserver, JRE vào Workspace.
    • 3. Import Nutch.
    • 4. Đặc tả CrawlDB
    • B. Tạo QLogs và lưu câu truy vấn
    • 1. CSDL
    • 2. Import thư viện JDBC vào Eclipse
    • 3. Lưu câu truy vấn
  • 2. A. Kết hợp Apache - JRE - Nutch vào Eclipse 1, Phiên bản Eclipse thực nghiệm: Eclipse EUROPA download tại: http://www.eclipse.org/downloads/moreinfo/jee.php
  • 3. A. Kết hợp Apache - JRE - Nutch vào Eclipse 2. Kết hợp Webserver Apache, JRE vào Workspace: Kết hợp Webserver: Vào menu Window. Preferences. Server. Installed Runtimes. Nhấn nút Add để add Webserver (Apache Tomcat).
  • 4. A. Kết hợp Apache - JRE - Nutch vào Eclipse 2. Kết hợp Webserver Apache, JRE vào Workspace: Kết hợp JRE: Nhấn button Next, chọn môi trường thực thi JRE (Java Runtime Environment)
  • 5. A. Kết hợp Apache - JRE - Nutch vào Eclipse 3. Import Nutch vào Workspace: Trên vùng Project Explorer, nhấn phải chọn Import. Web. WAR file để import Nutch vào Workspace.
  • 6. A. Kết hợp Apache - JRE - Nutch vào Eclipse 4. Đặc tả CrawlDB để thực hiện tìm kiếm: Trên vùng Project Explorer, từ thư mục Nutch vừa được triển khai trên, chọn built. classess, mở file nutch-site.xml, đặc tả thuộc tính value cho CrawlDB:
  • 7. A. Kết hợp Apache - JRE - Nutch vào Eclipse
    • trang search.jsp sử dụng phương thức GET để get data nằm trong URL string,
    • Webserver không nhận biết được encoding của câu lệnh request.setCharacterEncoding("UTF-8") mà sử dụng default encoding ISO-8859-1,
    • Đây là nguyên nhân khiến JSP form không phân giải được mã tiếng Việt UTF-8.
    • Trên vùng Project Explorer, từ thư mục Webserver vừa được kết hợp trên, mở file server.xml để thêm encoding nhận dạng URI (Uniform Resource Identifier):
    • <Connector URIEncoding=&quot;UTF-8&quot; connectionTimeout=&quot;20000&quot; port=&quot;8080&quot; ... >
    • - Running với F11.
  • 8. A. Kết hợp Apache - JRE - Nutch vào Eclipse Debug: Đặt điểm break point và sử dụng các phím chức năng như F5 (Step Into), F6 (Step Over), F7 (Step Return) để thực hiện debug.
  • 9. B. Tạo Qlogs và lưu câu truy vấn
    • CSDL để lưu các câu truy vấn: MS. SQL Server
    • Import lớp thư viện JDBC vào Eclipse
    • Bước 1. Download tại:
    • http://www.sourceforge.net/projects/jtds/develop
    • Bước 2. Copy file jtds - 1.2.5 . jar vào Workspace để build vào thư viện của Eclipse.
    • B3. Trên vùng Project Explorer, từ thư mục Nutch vừa được triển khai trên, nhấn phải chọn Properties. Java Build Path. Chọn tab Libraries. Click button Add External JARs để add file *.jar vừa copy trên. Sang tab Order and Export để click chọn thư viện này.
  • 10. B. Tạo Qlogs và lưu câu truy vấn Import lớp thư viện JDBC vào Eclipse (cont) Lưu câu truy vấn (search.jsp): Mặc định, Nutch lưu câu truy vấn của người dùng vào biến queryString. Nhằm thực hiện QLogs, nhóm Gợi ý truy vấn đề nghị sử dụng DBMS để lưu các câu truy vấn. Có thể sử dụng 1 đoạn mã lập trình nhỏ để lấy nội dung biến queryString và lưu vào QLogs.
  • 11. B. Tạo Qlogs và lưu câu truy vấn Lưu câu truy vấn (cont)
  • 12. B. Tạo Qlogs và lưu câu truy vấn
    • Các hàm chức năng:
    • - Hàm lấy thời gian: <%=date.toGMTString()%>
    • - Hàm lấy IP: request.getRemoteAddr()
    • Hàm lấy Session:
    • HttpSession session = request.getSession();
    • String id = session.getId();
    • Hàm lấy Cookies:
        • Cookie cookie = new Cookie (&quot;tên&quot;,giá trị);
        • Cookie.setMaxAge(365 * 24 * 60 * 60);
    • response.addCookie(cookie);
        • Cookie cookies [] = request.getCookies ()
        • Cookies[i].getValue()
    • - Hàm lấy URL clicked: ?