Trong bài
này, chúng ta sẽ tìm hiểu về
·
World Wide Web là
gì?
·
Lịch sử và vai trò của
công cụ tìm kiếm
·
Sơ lược về dò quét, tạo
chỉ mục và xây dựng thứ hạng
·
Những tiến bộ gần đây của
các công cụ tìm
kiếm
|
- World Wide Web là gì?
Về cơ bản, thế giới web
là tập hợp các trang web và các file (thuộc rất nhiều định dạng khác nhau) được
liên kết với nhau bởi hệ thống phức tạp của các liên kết hay links.
H
Các file trên thế giới web này có thể
thuộc những định dạng sau:
·
Hình
ảnh
·
Videos
·
File
pdf
·
Video
Flash
·
File
Javascript
Với nhiều định
dạng file khác nhau, nội dung trang web trở nên hấp dẫn hơn, thay vì thuần túy
là văn bản. Việc này gây khó khăn cho máy tìm kiếm, đặc biệt vào thời điểm nó
mới ra đời. Một phần vì kỹ thuật dò quét chưa thực sự phát
triển.
Cho đến ngày
nay, máy tìm kiếm vẫn gặp khó khăn với một vài định dạng file.
Là một người
làm SEO, bạn cần biết những định dạng file nào mà máy tìm kiếm gặp khó khăn để
không đưa những nội dung quan trọng vào các file này.
Lịch sử và vai trò của các máy tìm
kiếm
Thế giới web mới ra đời
trong hơn 20 năm.
Ngày đó, máy tìm kiếm vẫn chưa ra đời
– các website được biết đến chỉ nhờ truyền miệng, hoặc nhờ một trang web danh bạ
chứa địa chỉ của tất cả các trang web khác (web hub). Khi thế giới Internet vẫn
còn nhỏ, việc này ko vấn đề gì. Nhưng khi thế giới này mở rộng mạnh mẽ vào những
năm tiếp theo, một giải pháp mới là điều bắt buộc.
Trong suốt 1993/1994, những máy tìm
kiếm đầu tiên đã ra đời bao gồm Excite, AltaVista và Yahoo!. Số lượng các trang
web và người dùng tăng lên mạnh mẽ đến mức mà những trang web hub trở nên quá
tải và không còn hiệu quả.
Năm 1996, Google ra đời. Đây là máy
tìm kiếm đầu tiên nhận ra sức mạnh và vai trò của liên kết và sử dụng chúng để
đánh giá độ uy tín của trang web. Đây chính là bước đột phá giúp tăng chất lượng
bảng kết quả tìm kiếm.
Ba công việc chính
của máy tìm kiếm: Dò quét, Xây dựng cơ sở dữ liệu và Xếp
hạng
Về cơ
bản:
Dò quét: Là quá trình máy tìm kiếm đi tìm
những nội dung mới. Họ sử dụng những phần mềm có thể tự động ghé thăm các
website và lần theo liên kết trên các trang web để tìm ra những nội dung
khác.
Xây dựng cơ sở dữ
liệu: Các máy tìm kiếm copy nội dung
của các trang web mà chúng đã ghé thăm. Dữ liệu này được lưu trữ trên rất nhiều
máy tính trong các trung tâm dữ liệu (data center) ở khắp nơi trên thế giới.
Điều này giúp cho việc tìm kiếm trở nên nhanh chóng, dễ dàng hơn giúp bạn nhận
được kết quả chỉ trong 1/2s hoặc ít hơn.
Xếp hạng: Đây là công việc mà các SEO quan
tâm nhất. Khi một người tìm kiếm online, các cỗ máy này cần một thuật toán để
đánh giá trang web nhằm xác định trang web nào liên quan nhất, và từ đó tính ra
thứ hạng của trang web đó trên bảng kết quả
Những tiến
bộ gần đây của công cụ tìm kiếm
Bên cạnh đó, kết quả tìm kiếm không phân biệt theo
khu vực. Bất
kỳ ai trong một đất nước tìm kiếm một sản phẩm hay dịch vụ đều nhận được một
bảng kết quả như nhau.
Tuy nhiên,
trong những năm gần đây, đã có một số thay đổi:
Mạng xã
hội: Các
trang mạng xã hội như Facebook và Twitter giúp máy tìm kiếm biết chính xác trang
web nào đang được quan tâm. Máy tìm kiếm đã nhanh chóng cập nhật tín hiệu này
vào thuật toán, giúp bảng kết quả trở nên chính xác hơn, cập nhật
hơn.
Cá nhân hóa kết
quả tìm kiếm: Tương
tự, máy tìm kiếm thu thập lịch sử lướt web của người dùng. Lịch sử đó bao gồm:
những cụm từ nào được họ tìm kiếm nhiều, những trang web nào họ hay ghé thăm và
ở lại lâu. Từ đó, máy tìm kiếm có thể biết mức độ yêu thích của người dùng đối
với các trang web. Kết quả là với cùng một cụm từ, bảng kết quả tìm kiếm của
người này sẽ có khác biệt với bảng kết quả của người
khác.
Ví dụ trang
web vnexpress.net và 24h.com.vn. Tôi thích trang web này, bạn thích trang web
khác. Chúng ta ai cũng có quan điểm của riêng mình.
Máy tìm kiếm
đã tiến hóa rất nhiều trong những năm gần đây và từ đó thay đổi cách thức tìm
kiếm của mọi người, đặc biệt là Google. Cỗ máy này đã trở nên thông minh hơn rất
nhiều nhờ cơ chế tự học cũng như khả năng thu thập dữ liệu vượt trội giúp nó có
thể cung cấp kết quả phù hợp nhất với mong muốn người dùng. Sự vượt trội này của
Google thể hiện qua 2 tính năng dưới đây:
Google
Suggets: Ra đời
từ 8/2008. Khi bạn bắt đầu gõ, Google sẽ đề xuất từ khóa cho bạn, giúp bạn không
mất nhiều thời gian mà vẫn biết được từ khóa nào phù hợp nhất cho
mình.
Google
Instant: Ra đời
9/2010, Google Instant thay đổi đáng kể cách tìm kiếm bằng cách ngay lập tức
cung cấp kết quả dựa trên những ký tự mà người dùng gõ vào. Bạn sẽ thu được kết
quả ngay khi gõ mà không cần nhấn Enter.
Là một
chuyên gia SEO, bạn không chỉ cần biết những điều này, bạn còn phải nhận thức
ảnh hưởng của nó đến công việc. Cụ thể, bạn cần phải biết cách tìm kiếm sẽ thay
đổi như thế nào, cụm từ tìm kiếm sẽ thay đổi như thế khi những tính năng này ra
đời.