Bài giảng Internet - Bài 3: Tìm kiếm thông tin trên Internet

Tài liệu Bài giảng Internet - Bài 3: Tìm kiếm thông tin trên Internet: Bài 3: Tìm kiếm thông tin trên InternetTG: 6. LT: 2, TH: 41Mục tiêu- Trình bày được các khái niệm Engine, Meta Search Engine, Subject Directory;- Sử dụng thành thạo các kỹ thuật tìm kiếm trên mạng;- Xác định các nguyên tắc tìm kiếm và chọn lọc các thông tin tìm kiếm;- Vận dụng 6 kỹ năng tìm kiếm ( Big6) theo Eisenberg va Berkowitz;- Rèn luyện tính tổ chức kỷ luật, tính logic trong kỹ năng tìm kiếm.2Nội dung1. Giới thiệu về tìm kiếm2. Kỹ thuật tìm kiếm căn bản 3. Tìm kiếm thông tin với google31. Giới thiệu về tìm kiếm1.1. Khái quát về tìm kiếm thông tin1.2. Khái niệm Search engine, Meta-search engine, Subject directories1.3. Giới thiệu các công cụ tìm kiếm: Việt Nam và Quốc tế41.1. Khái quát về tìm kiếm thông tina) Mục đích sử dụng thông tin- Kết quả thông tin nhận được thường rất lớn nên gây mất tập trung cho sự chọn lựa. Vì vậy, cần xác định mục tiêu tổng quát khi tìm tin. Một tìm kiếm thông tin theo diện rộng sẽ tìm được một lượng lớn thông tin hơn tìm theo chiều sâu. Một cuộc tìm ...

ppt44 trang | Chia sẻ: honghanh66 | Lượt xem: 1066 | Lượt tải: 2download
Bạn đang xem trước 20 trang mẫu tài liệu Bài giảng Internet - Bài 3: Tìm kiếm thông tin trên Internet, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Bài 3: Tìm kiếm thông tin trên InternetTG: 6. LT: 2, TH: 41Mục tiêu- Trình bày được các khái niệm Engine, Meta Search Engine, Subject Directory;- Sử dụng thành thạo các kỹ thuật tìm kiếm trên mạng;- Xác định các nguyên tắc tìm kiếm và chọn lọc các thông tin tìm kiếm;- Vận dụng 6 kỹ năng tìm kiếm ( Big6) theo Eisenberg va Berkowitz;- Rèn luyện tính tổ chức kỷ luật, tính logic trong kỹ năng tìm kiếm.2Nội dung1. Giới thiệu về tìm kiếm2. Kỹ thuật tìm kiếm căn bản 3. Tìm kiếm thông tin với google31. Giới thiệu về tìm kiếm1.1. Khái quát về tìm kiếm thông tin1.2. Khái niệm Search engine, Meta-search engine, Subject directories1.3. Giới thiệu các công cụ tìm kiếm: Việt Nam và Quốc tế41.1. Khái quát về tìm kiếm thông tina) Mục đích sử dụng thông tin- Kết quả thông tin nhận được thường rất lớn nên gây mất tập trung cho sự chọn lựa. Vì vậy, cần xác định mục tiêu tổng quát khi tìm tin. Một tìm kiếm thông tin theo diện rộng sẽ tìm được một lượng lớn thông tin hơn tìm theo chiều sâu. Một cuộc tìm kiếm thông tin theo chiều sâu sẽ tìm được thông tin sát với chủ đề hơn, mặc dù số lượng thông tin sẽ ít hơn.51.1. Khái quát về tìm kiếm thông tinb) Chuẩn bị các từ khóa cần tìm- Bước xác định từ khóa và tạo lập chiến thuật tìm tin (sẽ đề cập ở phần sau) là rất quan trọng. Nhiều người, cứ bắt tay ngay vào việc tìm kiếm mà bỏ qua giai đoạn này nên mất rất nhiều thời gian, cuối cùng không thu được kết quả như ý muốn.61.1. Khái quát về tìm kiếm thông tin- Khái niệm từ khóa : Từ khóa là một từ hoặc cụm từ được rút trong tên chủ đề hoặc chính văn tài liệu, nó phản ánh một phần nội dung hoặc toàn bộ nội dung của chủ đề hoặc tài liệu đó.71.1. Khái quát về tìm kiếm thông tinCác bước tiến hànhB1 : Xác định từ chủ đạo để tìm kiếm thông tin cho lần đầu tiên.Ví dụ : Tìm hiểu bệnh SARS gây tử vong ở người. Từ chủ đạo là "bệnh SARS" do đó được tìm trước.B2 : Chọn từ có nghĩa, tránh chọn từ đa nghĩa, lọc bỏ các phụ từ (liên từ, giới từ, mạo từví dụ : và, với, and, the, a ).B3 : Xác định từ đồng nghĩa, từ có nghĩa liên quan (từ có nghĩa rộng hơn hoặc hẹp hơn)81.1. Khái quát về tìm kiếm thông tinc) Lập chiến thuật tìm- Mặc định của trang tìm kiếm là tìm đơn giản và cơ bản, cho nên kết quả tìm được là một lượng lớn thông tin, thỏa mãn từ cần tìm. Tuy nhiên, nhu cầu chúng ta cần là cụ thể và sát với chủ đề, do đó cần tạo lập chiến thuật tìm để khống chế kết quả cho phù hợp. Tạo lập chiến thuật tìm tin là việc thiết lập lôgích giữa các từ tìm kiếm. Việc sử dụng tốt các từ nối của toán tử lôgích (Boolean) sẽ cho kết quả tìm như ý.91.1. Khái quát về tìm kiếm thông tin- Các từ nối (phổ biến) Cách dùng Ví dụ:+ OR Hoặc từ này hoặc từ kia. Kết quả cho lượng tin rất lớn. Kinh tế OR Thương mại Kinh tế hoặc thương mại đều được+ AND dấu (+) Tất cả đều phải có. Kết quả được thu hẹp. Kinh tế AND Thương mại Cần có cả hai khái niệm+ NOT dấu (-) Loại trừ, giới hạn. Kinh tế NOT Thương mại Kết quả chỉ có khái niệm kinh tế, loại bỏ từ thương mại101.1. Khái quát về tìm kiếm thông tinLưu ý : Mỗi trang tìm kiếm có thể áp dụng hình thức kết hợp toán tử lôgích khác nhau. Vì vậy, cần đọc hướng dẫn trước khi áp dụng. Thông thường, ở phần tìm kiếm cơ bản đã có thể ứng dụng các từ nối nói trên.111.1. Khái quát về tìm kiếm thông tind) Kiên nhẫn và dùng nhiều trang tìm kiếm khác nhau- Mỗi trang tìm kiếm có những tiêu chí tìm khác nhau, vì vậy, kết quả tìm được sẽ khác nhau. Kết quả tìm đối với trang này có thể ít, nhưng trang khác thì rất phong phú hoặc ngược lại. Do đó, bạn nên dùng nhiều trang tìm kiếm khác nhau để tìm cùng một vấn đề mới có hiệu quả. Tất nhiên, bạn sẽ mất nhiều thời gian hơn. Vậy, kiên nhẫn là yếu tố giúp bạn sở hữu được thông tin cần thiết.121.2. Khái niệm Search engine, Meta-search engine, Subject directoriesa) Search engine: hay còn gọi là công cụ tìm kiếm giúp người xem tìm thấy những thông tin một cách liên quan nhất. Nó có thể tìm kiếm thông tin theo từ khoá, hình ảnh, địa điểm trên search engine. Khi nhận được câu lệnh yêu cầu tìm kiếm, search engine sẽ phân tích yêu cầu đó, đánh giá, sếp hạng và trả về kết quả liên quan nhất. Có thể tưởng tượng rằng search engine hoạt động theo quy trình như sau :131.2. Khái niệm Search engine, Meta-search engine, Subject directories+ Khảo sát – Crawl : là cách search engine tham quan, thu thập thông tin trên website. Search engine có những con bọ (spider hay crawler) được lập trình để có thể tự động theo các liên kết(link) để mò đến các website khác nhau, thu thập và đánh giá các thông tin trên website đó. Giai đoạn crawl là một giai đoạn rất quan trọng.14+ Lưu trữ - Index : là giai đoạn search engine lưu lại thông tin sau khi đã crawl. Với khối lượng lưu trữ vô hạn, các search engine có thể chứa hàng tỉ kết quả liên quan. Một trang web có thể được index nhanh hoặc chậm tuỳ thuộc vào tốc độ crawl, độ trust của website và nhiều yếu tố khác.151.2. Khái niệm Search engine, Meta-search engine, Subject directories+ Phân tích – Analysis : giai đoạn này search engine sẽ làm việc trên các dữ liệu mà nó thu thập được. Sau đó tính toán độ liên quan của dữ liệu so với yêu cầu của người dùng. Các search engine khác nhau có những thuật toán phân tích khác nhau từ đây tạo ra sự khác biệt giữa các search engine. Giai đoạn phân tích sẽ tạo tiền đề cho giai đoạn phía sau – Trả về kết quả161.2. Khái niệm Search engine, Meta-search engine, Subject directories+ Kết quả - Results : Các kết quả liên quan sẽ được hiển thị trong giai đoạn này. Những kết quả liên quan thường được sắp ở phía trên, cao hơn những kết quả ít liên quan. Mặc dù không phải lúc nào các kết quả cũng thoả mãn được yêu cầu của người tìm kiếm. Nhưng cho đến hiện nay, người dùng khá hài lòng với những gì mà search engine trả về.171.2. Khái niệm Search engine, Meta-search engine, Subject directoriesb) Meta-search engine:- Một meta-search engine không tự xây dựng bất cứ thành phần nào trong ba thành phần kể trên của một máy tìm kiếm thông thường. Thay vào đó, với mỗi câu truy vấn (query) của người dùng, meta-search engine sẽ chuyển nó đến các máy tìm kiếm như Google, Yahoo và sau đó xử lí kết quả trả về từ các máy tìm kiếm này trước khi trả ra kết quả cho người dùng.181.2. Khái niệm Search engine, Meta-search engine, Subject directories- Điểm mạnh: Meta search engine không phải tốn tài nguyên cho việc thu thập và lưu trữ các trang web. Thay vào đó meta search engine chủ yếu tập trung vào phát triển các thuật toán xử lí kết quả từ các máy tìm kiếm khác. Các thuật toán xử lí thông thường gồm có gom cụm (clustering) để loại bỏ trùng lắp, và phân tích ngữ nghĩa (semantic analysis) để có thể cho kết quả gần với yêu cầu của người dùng nhất.191.2. Khái niệm Search engine, Meta-search engine, Subject directories- Điểm yếu:+ Thứ nhất, tốc độ của các meta-search engine thường chậm vì phải chờ kết quả trả về từ các máy tìm kiếm khác. Nếu một meta-search engine gửi câu truy vấn đến càng nhiều máy tìm kiếm, tốc độ càng chậm. Có thể xem một ví dụ của zingsearch.+ Thứ hai, khả năng tìm kiếm nâng cao như các máy tìm kiếm thông thường khác bị hạn chế. Các toán tử tìm kiếm AND, OR và tìm kiếm theo cụm từ (phrase) có thể không được hỗ trợ201.2. Khái niệm Search engine, Meta-search engine, Subject directories+ Thứ ba, kết quả trả về của meta-search engine chưa chắc tốt hơn kết quả của một máy tìm kiếm (ví dụ Google) . Lí do chính là các máy tìm kiếm lớn đều đã có thuật toán rất phức tạp để tối ưu hóa kết quả tìm kiếm. Các meta-search engine có thuật toán đơn giản thường sẽ không thể cho kết quả tốt hơn kết quả trả về từ các máy tìm kiếm này. Google cho kết quả trả về quá tốt, hơn hẳn Yahoo và Microsoft, kết hợp 3 thứ này có thể sẽ ra một thứ tệ hơn kết quả của Google. Nhưng kết hợp các kết quả của các máy tìm kiếm khác ko quá tốt (như Google) thì có thể sẽ giúp cho kết quả tốt hơn.21+ Thứ tư, việc gửi câu truy vấn đến các máy tìm kiếm khác phải chịu hai sự hạn chế: thứ nhất là kết quả trả về cho mỗi lần truy vấn ít (ví dụ Google chỉ cho phép tối đa 32 kết quả), thứ hai là số lượng câu truy vấn gửi đi trong ngày bị giới hạn (ví dụ Google SOAP API trước đây chỉ cho phép tối đa 1,000 câu truy vấn/ngày). Những hạn chế này được đặt ra để đảm bảo rằng meta-search engine không thể nào vượt qua được các máy tìm kiếm mà nó dựa vào.221.2. Khái niệm Search engine, Meta-search engine, Subject directoriesVí dụ của bộ máy siêu tìm kiếm - Metacrawler – Dogpile – ProFusion – Khái niệm Search engine, Meta-search engine, Subject directoriesc) Subject directories:- Còn gọi là máy truy tìm theo phân lớp (hierarchical search engine)  - search engine kiểu này sẽ phân lớp sẵn các đối tượng vào các thư mục và người dùng sẽ lưạ rẻ nhánh từ từ cho đến khi tìm ra các trang WEB mà mình muốn. Kiểu này dể cho người tuy cập nhưng có điểm yếu là nó không thể bao gồm hết mọi chủ đề mà mình muốn kiếm ra. Hơn nưã, sự phân loại đôi khi không được đầy đủ và chính xác. Điển hình cuả loại này là www.yahoo.com241.2. Khái niệm Search engine, Meta-search engine, Subject directories1.3. Giới thiệu các công cụ tìm kiếm: Việt Nam và Quốc tếa) Việt Nam:- Cốc Cốc- PanVietnam.com (đã ngưng sử dụng)- Hoatieu.com- Vinaseek.com25b) Thế giới:- GOOGLE- BING- WOLFRAM ALPHA- YAHOO- BAIDU- YANDEX- DUCK DUCK GO- TWURDY- ASK- AOL* Chi tiết truy cập: Giới thiệu các công cụ tìm kiếm: Việt Nam và Quốc tế2. Kỹ thuật tìm kiếm căn bản 2.1. Phân tích yêu cầu2.2. Các phép toán của lệnh tìm: +, -2.3. Sử dụng toán tử luận lý: AND, OR2.4. Thu hẹp phạm vi tìm: Định dạng file, ngôn ngữ, địa chỉ DNS2.5. Từ khóa2.6. Sáu kỹ năng tìm kiếm (Big6) theo Eisenberg và Berkowitz272.1. Phân tích yêu cầuXem lại slide 5-12282.2. Các phép toán của lệnh tìm: +, -* Lệnh tìm kiếm đối với các cụm từ nhất định - Cấu trúc: "+" search- Vì Google có xu hướng bỏ qua một số từ hoặc kí tự thông dụng như: "where" và "how", các con số đơn và chữ cái, nên nếu trong từ khoá của bạn những từ này, bạn cần phải cho thêm dấu "+" vào trước (nhớ là có khoảng trắng trước dấu "+"). - Ví dụ: Bạn cần tìm kiếm bộ film Star Wars tập 1, thay vì bạn gõ cả cụm từ Star Wars Episode I vào ô tìm kiếm, bạn cần chia từ khoá này thành 2 phần vì nó có chứa con số (số 1)292.2. Các phép toán của lệnh tìm: +, -* Lệnh loại trừ- Cấu trúc: "-" search- Trong nhiều trường hợp, từ khoá của bạn có thể khiến công cụ tìm kiếm cho ra nhiều kết quả không mong muốn, chính vì vậy bạn cần phải bổ xung dấu "-" (loại trừ trước những khái niệm bạn không muốn hiển thị.- Ví dụ: từ "bass" trong tiếng Anh có 2 nghĩa, vừa chỉ tên một loại cá, vừa có liên quan tới âm nhạc. Nếu bạn chỉ muốn tìm kiếm nghĩa "cá" của từ này mà không quan tâm tới nghĩa "âm nhạc", bạn cần phải cho thêm dấu "-" vào trước từ "music"302.3. Sử dụng toán tử luận lý: AND, OR* Lệnh AND (Và)- Cái này khá giống với lệnh số “+”. Có thể tìm kiếm các chủ đề có 2 từ khóa để lọc chi tiết hơn. Ví dụ khi muốn tìm các bài viết về trẻ em, nhưng chỉ muốn hiển thị các bài về trẻ châu Á thôi thì mình sẽ search: kids and asianNhư vậy chúng ta sẽ sử dụng lệnh “and"312.3. Sử dụng toán tử luận lý: AND, OR* Lệnh OR- Tìm 1 trong 2 từ khóaVí dụ: TCNDucPho OR Duc Pho322.4. Thu hẹp phạm vi tìm: Định dạng file, ngôn ngữ, địa chỉ DNS- Giới hạn định dạng file Filetype: phần mở rộng file Tìm file mp3, wav, - Giới hạn theo ngôn ngữ (tiếng anh, pháp, việt)- Giới hạn theo từng loại địa chỉ web (các trang web có đuôi .gov.vn, hoăc .edu)- Giới hạn theo địa điểm xuất hiện của từ tìm kiếm (ở trong tài liệu hoặc nội dung)- Tìm tranh ảnh or bản đồ332.5. Từ khóa- Dùng dấu ngoặc kép "..." để có được kết quả chính xác với cụm từ cần tìm.- Với các từ khóa dễ gây hiểu nhầm, người dùng có thể thêm dấu trừ - để thu hẹp kết quả, chẳng hạn khi viết mustang-horse, Google sẽ loại thông tin liên quan đến ngựa mà hiển thị link về xe Mustang, trong khi nếu viết mustang -car, họ sẽ có được các thông tin về loài ngựa.- Dùng dấu site: để tìm kiếm thông tin trên một trang web cụ thể342.5. Từ khóaKhi nghe một bài hát hoặc một câu trích dẫn nổi tiếng, nếu không nghe rõ một vài từ, người dùng có thể nhờ Google điền vào chỗ trống bằng cách sử dụng dấu *. Chẳng hạn, khi gõ "in your memory do you loving me", Google sẽ không cho kết quả đúng. Nhưng khi gõ "in your * memory do you * loving me", Google sẽ nhận ra đó là lời bài hát Melodies of Life và điền đúng là "In your dearest memory, do you remember loving me". 352.5. Từ khóaNếu muốn tìm những website có nội dung, đặc điểm giống với một website mà bạn biết, chẳng hạn muốn truy cập website bán sách giống Amazon.com, bạn có thể dùng từ khóa related: và Google sẽ hiển thị các trang như eBay, Barner & Noble...362.6. Sáu kỹ năng tìm kiếm (Big6) theo Eisenberg và BerkowitzTheo Eisenberg và Berkowitz (1996) 376 Kỹ năng chính (Big6): Xác định nhiệm vụ : Xác định yêu cầu, xác định nhu cầu thông Chiến lược tìm kiếm thông tin : Động não tìm ra tất cả các nguồn có thể tìm, chọn lọc nguồn có khả năng giải quyết vấn đề lớn nhất 3. Định vị và truy cập : Chọn nguồn, Tìm kiếm thông tin trong nguồn lực đóSử dụng thông tin: Rà soát, truy xuất thông tin phù hợp Tổng hợp: Tổ chức thông tin, trình bày kết quả Đánh giá: Đánh giá kết quả và quy trình tìm kiếm3. Tìm kiếm thông tin với google3.1. Khám phá giao diện3.2. Các nhóm tìm kiếm3.3. Tìm kiếm cơ bản: Sử dụng các toán tử luận lý, ký tự đặc biệt, cú pháp URL3.4. Tìm kiếm nâng cao3.4.1. Cú pháp từ khóa mở rộng3.4.2. Giới thiệu các toán tử mở rộng383.1. Khám phá giao diện393.2. Các nhóm tìm kiếm403.3. Tìm kiếm cơ bản: Sử dụng các toán tử luận lý, ký tự đặc biệt, cú pháp URL413.4. Tìm kiếm nâng cao- Truy cập địa chỉ: Cú pháp từ khóa mở rộngXem lại slide 34-36433.4.2. Giới thiệu các toán tử mở rộngXem lại slide 34-3644

Các file đính kèm theo tài liệu này:

  • pptbai3_internet14kl_444.ppt
Tài liệu liên quan