NewYork Paris Hà Nội Khách thứ :

NIỀM TIN TƯƠNG LAI

     

Google : Một Hiện Tượng - Nguyễn Trọng Cơ , Kiều bào Mỹ

Tháng tư năm ngoái, sau khi làm “nhức đầu” Microsoft với dịch vụ Điện thư (web-based mail service) miễn phí tên Gmail, có sức lưu trữ 2 Gig (2 tỷ byte), cuối tháng sáu năm nay, 2005, Google đã làm ngạc nhiên khách hâm mộ Internet với Google Earth (Địa cầu Google). Đây là một nhu liệu/phần mềm ứng dụng (application software), khi hoạt động cho người xem có cảm giác như bay trong không gian, quan sát địa cầu từ xa, hay nếu muốn, phóng đại ảnh (zoom in) từng vùng trên trái đất. Mặc dù miễn phí, ta đã được nhìn địa cầu từ trên cao, qua những góc độ khác nhau, một phần giống như Greg Olsen, người đã phải trả 20 triệu đô la để du lịch 10 ngày trên không gian qua phi thuyền Soyuz và Trạm không gian quốc tế.

Để “download” (nạp xuống) ứng dụng này chúng ta vào Earth.Google.com, “click” (bấm) tại khung “Get Google Earth free version” rồi làm theo chi tiết chỉ dẫn trên màn. Sau khi đã mang Google Earth vào chạy trên máy, ta phải tiếp tục nối với Internet hầu liên tục nhận tin tức từ “Google servers” (Hệ phục vụ của Google). Ở đây có hàng ngàn tỷ “bytes” dữ kiện của công ty Keyhole mà Google đã mua tháng 10 năm ngoái, chờ đợi chúng ta sử dụng. Là một hãng chuyên về “Digital and Satellite Image Mapping” (Tạm dịch: Vẽ bản đồ bằng hình ảnh qua vệ tinh và kỹ thuật số), khi sát nhập vào Google, Keyhole đã cung cấp cho người dùng một nhu liệu tìm kiếm hữu hiệu những hình ảnh ba chiều (3D) của mặt đất cũng như những cơ sở dữ liệu (database) về đường xá, cơ sở thương mại, và những điểm đáng chú ý khác. Mặc dù những phong cảnh trông rất thực nhưng đây không phải là hình ảnh sống (real time) vì có nhiều hình đã được thu cách đây hai, ba năm. Tuy nhiên Google thường xuyên cập nhật dữ kiện: hiện nay ta có thể quan sát những vùng bị tàn phá bởi trận động đất vừa qua tại Pakistan.

Khi “zoom in” để nhìn chi tiết của từng vùng, có chỗ ta nhìn rất rõ, có chỗ bị mờ. Lý do vì khối lượng dữ kiện của Google được lấy từ nhiều nguồn khác nhau và do đó có độ Phân giải (resolution) không đều. Hiện nay, Google đã có cơ sở dữ liệu khá tốt về Mỹ quốc, Gia nã Đại, Anh quốc và Tây Âu, do đó ảnh phóng đại của những vùng này có thể cho ta thấy tên từng con đường, hay có thể từng căn nhà, cũng như những cơ sở thương mại quan trọng. Tuy nhiên những chi tiết về những vùng khác thì không được rõ ràng như vậy. Ngoài ra vì đây chỉ là Bản chạy thử chót (beta version) nên có thể vẫn còn những lỗi kỹ thuật (bugs).

Bây giờ ta hãy thử dùng chuột (mouse) “click” vào hộp “Fly to” ở góc đỉnh bên trái của màn và đưa vào ô ở dưới đó số nhà, đường phố, và “zip code” của một địa chỉ ở Hoa kỳ hay Anh quốc, sau đó bấm vào hộp “Search”. Google sẽ cho ta cảm giác bay từ từ đến nơi này. Khi đến nơi ta có thể “zoom in” để nhìn những chi tiết chung quanh căn nhà như vườn tược, cây cối, hồ bơi,... Ta cũng có thể “click” vào những tầng (layers) khác nhau ở phía dưới để có thêm tin tức về đường xá, cây xăng, tiệm ăn, tiệm cà phê, nhà bank,... Thêm vào đó, ngoài khả năng quay hình qua trái hay phải, ta có thể làm nghiêng hình (tilt) để có thể có cảm giác ở trong không gian ba chiều. Ta cũng có thể tìm tin tức trong từng vùng khi dùng “Local Search”, hay lấy hướng dẫn để lái xe từ chỗ này qua chỗ kia khi bấm hộp “Directions”...

Từ địa chỉ ở trên, nếu ta đưa vào địa chỉ “saigon, vietnam” rồi bấm “Search”, ta sẽ được bay qua nhiều lục địa, đại dương để về Sài Gòn. Với tên mới, thành phố có vài chi tiết sơ sài, và như trên đã nói, hình ảnh đường phố rất mù mờ. Để trở lại Little Saigon ở California, ta đánh “little saigon, california, usa” rồi bấm “Search”. Bất ngờ, máy in ra một dòng báo “your search returned no results!” (không tìm được!). Vô lý, Little Saigon rất nổi tiếng, làm sao máy “dốt” quá vậy! Chắc nhu liệu có một một “bug” nào đó. Ta hãy dùng giải pháp đi vòng: đánh “garden grove, california, usa” rồi bấm “Search”. Tốt, đến được! Bây giờ đánh trở lại “little saigon, california, usa” rồi bấm “Search”. Thành công! Little Saigon hiện ra với đường xá khang trang và những quán ăn quen biết. Ta có thể tiếp tục hưởng thú “vân du” khi đi thăm Grand Canyon, Kim tự tháp Ai cập, vv... Dĩ nhiên để có nhu liệu có phẩm chất tốt hơn cùng với những chọn lựa (options) khác nhau, ta có thể đóng tiền để dùng “Google Earth Plus”, hay “Google Earth Pro.”

Khi những dòng này được viết thì trong thị trường chứng khoán giá mỗi cổ phần (share) của Google Inc. khoảng 420 đô la so với giá vào tháng 8 năm ngoái xấp xỉ 100. Trong khi đó, ở cùng khoảng thời gian này giá cổ phần của các đại công ty như Microsoft, IBM, Sun Microsystems, Oracle, Yahoo,... thay đổi rất ít. Ở tình trạng trì trệ kinh tế như hiện nay, quả đây là một sự thành công ngoạn mục về tài chánh. Chưa hết, năm nay Google còn đạt một vinh dự khác: được tạp chí Scientific American bầu là “Cơ sở thương mại hàng đầu trong năm” (Business Leader of the Year).

Hiện nay Google có chừng 3000 nhân viên với tài sản thương mại (market cap) khoảng 120 tỷ đô la so với Microsoft khoảng 290 tỷ và IBM khoảng 140 tỷ. Chuyên về máy tìm (search engine) trên Internet và những dịch vụ liên hệ, Google đang bành trướng mạnh mẽ trên toàn thế giới. Ngay từ năm 2001, người dùng ở mọi nơi có thể tìm kiếm tin tức trên mạng bằng 28 ngôn ngữ khác nhau. Gần đây, năm 2004, Google đã hãnh diện thông báo một trụ sở mới ở Âu châu với 150 nhân viên từ 35 quốc gia, nói 17 thứ tiếng.

Để bành trướng, Google phải tìm mua những hãng có kỹ thuật cao mà Keyhole là một, tạo đồng minh, và dĩ nhiên lôi kéo nhân tài. Trong số những cộng sự viên, trước hết ta phải kể đến Craig Silverstein, bạn đồng môn tại Stanford của Sergey Brin và Larry Page, hai người đã khai sinh ra Google. Với chức giám đốc kỹ thuật, và đã tham gia Google từ những ngày đầu tiên, Silverstein được coi là người đứng sau hậu trường điều khiển chiến lược của Google. Làm việc rất chăm chỉ, tay giám đốc 32 tuổi này đang kiểm soát thứ tự ưu tiên cho những dự án (projects) của Google cũng như những phương thức toán học tìm lời giải từng bước (mathematical algorithm) của máy tìm.

Một nhân vật quan trọng khác là Eric Schmidt, người được mời làm chủ tịch và giám đốc điều hành của công ty từ năm 2001. Schmidt đã từng làm việc cho Novell, Sun Microsystems, Xerox, Bell Lab, và đã có Ph.D. tại UC Berkeley. Thêm vào đó, khi nhìn vào danh dách ban giám đốc (board of directors) ta còn thấy những tên tuổi lẫy lừng như John Hennessy của đại học Stanford, Shirley M. Tilghman từ đại học Princeton và Paul Otellini, giám đốc điều hành hãng Intel.

Đặc biệt, để trông coi cơ sở Khảo cứu và Phát triển (R & D) tại Trung quốc, tháng 5 vừa qua Google đã mời được Kai Fu-Lee từ Microsoft. Có Ph.D. tại đại học Carnegie Mellon, Lee là một chuyên viên về Nhận biết tiếng nói (speech recognition). Lee đã làm việc với Microsoft từ năm 1998, và có công thiết lập phòng thí nghiệm khảo cứu của Micorsoft ở Trung hoa lục địa. Tại đây với khoảng 100 triệu người dùng Internet, theo tiên đoán số thương vụ về online (trực tuyến), wireless (vô tuyến), games (trò chơi vi tính) và interactive (hoạt động tương tác) có thể lên đến nhiều tỷ đô la trong vòng 5 năm tới. Microsoft đã dòm ngó thị trường này từ lâu, và coi việc ra đi của Lee là một sự bội ước. Theo Microsoft, họ xử Lee rất hậu: năm 2000 Lee được thăng chức phó chủ tịch và đã được trả khoảng 4 triệu đô la trong khoảng thời gian 2000-2004. Hiện nay Microsoft đang kiện cả Lee và Google về tội vi phạm Thoả thuận cấm cạnh tranh (noncompete agreement). Còn Lee và Google thì đang dựa vào luật California để vô hiệu hoá sự kết tội này...

Đã đến lúc ta trở lại với Brin và Page, hai sáng lập viên của Google.

Sergey Mihailovich Brin (Sergey Brin) và Lawrence E. Page (Larry Page) có nhiều điểm chung: cùng có gốc Do thái, cùng sinh năm 1973, cùng có bố làm nghề dạy học, cùng thích và giỏi về computer từ nhỏ, cùng là ứng viên tiến sĩ (Ph.D. candidates) tại đại học Stanford, California,...Tuy nhiên, Brin sinh tại Moscow, Nga và theo gia đình di cư vào Mỹ năm 1979, còn Page thì sinh tại tiểu bang Michigan, Hoa kỳ.

Khi đến Stanford, khởi đầu Brin nghiên cứu về Data mining (Đào xới dữ kiện) và Pattern extraction (Khai thác mẫu dạng), hai hướng khảo cứu đang thịnh hành lúc đó. Brin gặp và quen Page khi có nhiệm vụ đưa chàng này đi thăm khuôn viên Stanford. Sau đó họ làm việc chung nhưng không thuận thảo lắm, và hầu như luôn luôn tranh cãi khi đề cập về bất kỳ đề tài nào. Tuy nhiên họ có một điểm quan tâm chung: làm sao để tìm được những tin tức hữu dụng trong hàng núi dữ kiện trên Internet. Năm 1998, họ cùng công bố một bài viết có tính cách cơ bản, sau này trở thành một trong 10 bài được tìm đọc nhiều nhất tại đại học Stanford. Đó là bài "The Anatomy of a Large-Scale Hypertextual Web Search Engine", tạm dịch: Cấu trúc chi tiết của một máy Tìm có quy mô lớn trên Mạng dùng Hypertext (một cách viết đặc biệt dùng trong trang web).

Trong bài viết này ta thấy Brin và Page giới thiệu mẫu đầu tiên (prototype) của một máy tìm loại lớn, có thể trả lời thật nhanh và chính xác những Truy vấn (queries) của người dùng. Với số lượng khổng lồ của các trang web, và độ gia tăng đến chóng mặt của những dữ kiện mỗi ngày, trong lúc thiết kế (design), máy phải có một tính chất đặc biệt: vừa có quy mô lớn vừa có thể tăng trưởng (scalable) dễ dàng. Để mô tả mục tiêu tiến đến một máy tìm vĩ đại, họ đặt tên máy là Google, từ chữ googol, một từ được dùng để chỉ một số vô cùng lớn: 10**100 (10 lũy thừa 100; gồm số 1 với 100 con số không theo sau).

Như vậy Google hoạt động ra sao?

Ta đã biết là mỗi web site (điểm mạng) có một địa chỉ thường được gọi là URL (Uniform Resource Locator), thí dụ như http://www.yahoo.com/, để từ đó những Browser (bộ duyệt tìm) có thể đi tới và đọc những trang web trong đó. Những trang web này thường được viết bằng một loại ngôn ngữ đặc biệt có tên HTML (HyperText Markup Language), và có thể có những Link (nối) để nhẩy tới những trang web khác. Những tin tức mà chúng ta muốn tìm có thể nằm đâu đó trên những trang web của hàng triệu web site trên Internet. Google không chờ đến lúc có truy vấn mới đi tìm dữ kiện vì như vậy rất mất thì giờ. Máy phải thành lập sẵn một loại tự điển khổng lồ, hiện đại.

Để làm điều này, trước hết Google cho những nhu liệu gọi là Máy bò (crawler), dựa vào danh sách những URL trên Internet, download những trang web, Nén lại (compress) và bỏ vào một Kho chứa (depository) thật lớn. Mỗi trang web bây giờ trở thành một loại tài liệu (document), được cho một Số nhận dạng (ID, identification), gọi là docID (số nhận dạng tài liệu). Để lọc lựa và sắp xếp những chữ (word) có ý nghĩa và những link trên những trang tài liệu này, một nhu liệu có tên Indexer (nhu liệu lập chỉ số) được dùng. Những chữ cùng những chi tiết về link được cho một Số nhận dạng chữ (wordID) và được chuyển đến những bộ phận tồn trữ đặc biệt gọi là Thùng chứa (barrels).

Một nhu liệu khác có tên Sorter (nhu liệu lập thứ tự) sắp xếp các chữ theo thứ tự wordID và tạo nên một Danh sách có chỉ số ngược (inverted index). Gọi là “ngược” vì từ những chữ trong danh sách này, vốn giống như những chữ của một cuốn tự điển, ta có thể tìm lại tất cả những chi tiết liên hệ đến hình dạng (kiểu chữ, độ lớn), nguồn gốc (URL, link,...),... của chữ đó. Phương pháp tạo chỉ số (indexing) đã giúp máy tìm ra thật nhanh những chi tiết cần thiết. Một cách lập chỉ số quen biết có tên ISAM (Index sequential access mode) đã được Google sử dụng để tạo chỉ số cho các docIDs. Cộng vào đó với sự nghiên cứu cẩn thận về cách thiết kế, kỹ thuật tồn trữ, lối tìm kiếm, Google đã đạt được vận tốc vô cùng nhanh.

Thí dụ như khi ta muốn truy vấn dòng chữ “little saigon california”, thì Google sẽ tức khắc đổi các chữ trên thành các wordIDs và lục thật nhanh trong các “barrels” để đưa ra kết quả: trong vòng dưới 0.45 giây, Google sẽ đưa ra danh sách trên 800,000 trang web liên hệ!

Tới đây vấn đề nhanh coi như đã giải quyết xong, chỉ còn vấn đề chính xác.

Ta không có thì giờ để lục hết hàng trăm ngàn trang web mà Google đưa ra, ta muốn có chi tiết cần biết trong những trang web đầu tiên. Để phần nào đọc được ý nghĩ của chúng ta, Brin và Page đã đưa ra một phép tính dựa vào những links giữa các trang web, gọi là PageRank (Phân cấp Trang), để lập thứ tự quan trọng của những trang web đã được tìm. Ta có thể nhận ra giá trị của PageRank nếu ta có thể thấy điều muốn biết trong 10 trang web đầu của bảng kết quả. PageRank được cấp bằng phát minh (patented) năm 2001 dưới tên đại học Stanford, với Lawrence Page là người phát minh...

Biết rõ khả năng của mình và biết mình muốn gì, giữa năm 1998 Brin và Page quyết định ngưng học Ph.D. để mở công ty riêng. Họ viết Dự án thương mại (business plan) cho công ty và đi gõ cửa các nhà đầu tư để gây vốn. Tháng 9 năm 1998, Google Inc. ra mắt tại Menlo Park, California với số nhân viên là ba người (Brin, Page và Silverstein). Để mở cửa văn phòng họ phải dùng một Remote control (thiết bị viễn khiển) vì công ty nằm trong nhà để xe của một người bạn. Tuy nhiên phẩm chất của máy tìm ở Google.com, mặc dù đang là bản chạy thử cuối cùng (beta) và dĩ nhiên miễn phí, đã được đánh giá cao bởi các báo USA Today, Le Monde và PC Magazine. Mỗi ngày có khoảng 10,000 truy vấn.

Tháng 2 năm 1999, với số truy vấn mỗi ngày lên đến 500,000, công ty phải tăng số nhân viên lên thành tám người và dọn đến trụ sở mới tại Palo Alto. Uy tín lên cao, Google được các công ty đàn anh mời vào đồng minh và đến tháng 6, tình trạng tài chánh của công ty đã được bảo đảm nhờ 25 triệu đô la đầu tư từ hai công ty Sequoia Capital và Kleiner Perkins Caufield & Byers. Từ đây công ty tiếp tục phát triển mạnh: tháng 9 máy tìm chấm dứt chạy thử để bắt đầu chạy chính thức, và số truy vấn lên tới 3 triệu mỗi ngày.

Trong khi uy tín của máy tìm Google miễn phí cho quần chúng càng lên cao thì các dịch vụ như bán kỹ thuật tìm kiếm (search technology) và quảng cáo trên Internet càng mang nhiều lợi nhuận cho Google. Cuối năm 2001 công ty bắt đầu có lời và từ đó Google lên như diều gặp gió.

Có khả năng, chăm chỉ, yêu nghề, nhìn xa trông rộng, và dám chấp nhận thử thách, Brin và Page thành công là phải. Tuy nhiên họ đạt được thành công lớn như hiện nay là nhờ “Thiên thời.” Đúng như Silverstein nói, “ Google was in the right place at the right time” (tạm dịch: Google đã đến đúng chỗ, đúng lúc). Theo ước tính, lúc giá mỗi cổ phần của Google khoảng 111 đô la, thì Brin và Page mỗi người có khoảng 11 tỷ đô la. Bây giờ, với giá mỗi cổ phần tăng lên gần gấp bốn, thì gia sản của họ phải lớn hơn nhiều. Mới đây hai người đã mua một phản lực cơ chở khách cỡ lớn, Boeing 767, để làm phương tiện di chuyển riêng...

Coi công việc là một thú vui và luôn luôn công khai tuyên bố “Don’t be evil” (Không làm điều xấu), những người ở Google sẽ còn cho chúng ta nhiều ngạc nhiên trong những ngày tới.