Thứ Năm ngày 28 tháng 3 năm 2024

Tech MediaOnline

Search On 2022: những đột phá và ứng dụng AI trong hành trình Google Search vượt xa việc tìm kiếm đơn thuần

Search On 2022: những đột phá và ứng dụng AI trong hành trình Google Search vượt xa việc tìm kiếm đơn thuần
September 29
18:59 2022

Tập đoàn công nghệ Google ngày 28-9-2022 đã tổ chức sự kiện Search On 22 chuyên về công cụ tìm kiếm Google Search nổi tiếng và là “bùa hộ mạng” hay “bạn đồng hành” của hàng tỷ người trên hành tinh. Từ bao nhiêu năm nay (Google Search ra đời vào năm 1998), công cụ tìm kiếm thông tin trên Internet này xứng danh là một “nhà thông thái vĩ đại của mọi thời đại”, là “người biết tuốt mọi thứ”, thậm chí cái tên “Google” đã được dùng như một động từ “google” để chỉ việc tìm kiếm bằng Google Search. Google nói rằng: “Trong sự kiện này, bạn sẽ nghe về cách Google đang hình dung lại các sản phẩm thông tin cốt lõi của mình để giúp mọi người hiểu thế giới theo những cách tự nhiên và trực quan hơn.” Bạn có thể tìm hiểu thêm về sự kiện Google Search On 2022 tại đây.

Nhân dịp này, trên Google Blog ngày 28-9-2022, ông Prabhakar Raghavan, Phó Chủ tịch Cấp cao, Google Search, đã có bài viết nói về cách mà Google đã làm cho công cụ Search trở nên tự nhiên và trực quan hơn. Với sự hỗ trợ từ đại diện truyền thông của Google tại Việt Nam, MediaOnline xin giới thiệu cùng bạn đọc bản tiếng Việt của bài viết này.

Ông Prabhakar Raghavan.

Hơn hai thập kỷ phát triển, chúng tôi vẫn luôn cống hiến hết mình cho một sứ mệnh chung: hệ thống hóa thông tin của thế giới, giúp những thông tin đó trở nên hữu ích và dễ dàng tiếp cận trên toàn cầu. Bắt đầu với việc tìm kiếm bằng văn bản, qua thời gian, chúng tôi đã có thể sáng tạo ra một cách thức mới tự nhiên và trực quan (natural and intuitive) hơn cho việc tìm kiếm thông tin – với ống kính máy ảnh, hoặc đặt câu hỏi bằng giọng nói của mình, chẳng hạn.

Tại sự kiện Search On ngày hôm nay, chúng tôi cho thấy sự tiến bộ của trí tuệ nhân tạo (AI) đã một lần nữa cho phép Google cải tiến các sản phẩm thông tin của mình. Không còn đơn thuần là một thanh tìm kiếm, chúng tôi đã sáng tạo ra một công cụ vận hành đa chiều như bộ não của con người chúng ta.

Chúng tôi đã hình dung về một thế giới nơi mọi người có thể tìm kiếm chính xác những gì họ cần bằng cách kết hợp hình ảnh, âm thanh, văn bản và giọng nói, giống như những gì chúng ta vẫn hay làm. Bạn có thể đặt những câu hỏi ngắn hơn – hoặc thậm chí là không có – nhưng Google vẫn biết được chính xác bạn đang cần gì, hoặc hiển thị những điều bạn thấy hữu ích, cá nhân hóa việc khám phá thông tin của bản thân.

Chúng tôi gọi đây công cuộc biến việc tìm kiếm trở nên tự nhiên và trực quan hơn, tuy nhiên, vẫn còn một chặng đường dài để hoàn thành mục tiêu này và gửi đến mọi người. Để bạn có một cái nhìn tổng quát về cách chúng tôi đang phát triển các sản phẩm thông tin của mình trong tương lai, mời bạn xem qua ba điểm nổi bật tại sự kiện Search On ngày hôm nay.

Tìm kiếm qua hình ảnh chân thực hơn

Hàng trăm năm qua, máy ảnh vẫn thường được nghĩ đến như là nơi lưu giữ kỷ niệm, hoặc với bối cảnh hiện nay, nhiều người dùng vẫn hay sử dụng nó để sáng tạo nội dung. Nhưng máy ảnh còn là thiết bị hữu ích để truy cập thông tin và hiểu thêm về thế giới xung quanh, thậm chí, nếu gọi máy ảnh là bàn phím tiếp theo của bạn cũng không hề sai. Đó là lý do cho sự ra đời của Google Ống Kính (Google Lens) vào năm 2017, nhằm giúp bạn tìm kiếm thông qua máy ảnh hoặc hình ảnh. Giờ đây, thời đại của việc tìm kiếm qua ảnh đã đến – trên thực tế, có hơn 8 triệu câu hỏi được trả lời mỗi tháng qua Google Ống Kính.

Chúng tôi vẫn tiếp tục làm việc để biến việc tìm kiếm qua hình ảnh trở nên tự nhiên hơn với Tìm Kiếm Đa Dữ Liệu (multisearch) – một cách hoàn toàn mới để “search” bằng cách sử dụng đồng thời cả hình ảnh và văn bản, tương tự như cách bạn tò mò về một thứ gì đó và đặt câu hỏi với bạn bè. Đầu năm nay, chúng tôi đã giới thiệu bản dùng thử tính năng Tìm Kiếm Đa Dữ Liệu ở Mỹ, và tại sự kiện Search On 2022, Google đưa ra thông báo về bản cập nhật hơn 70 ngôn ngữ khác sẽ được ra mắt trong những tháng tới. Ngoài ra, “Tìm Kiếm Đa Dữ Liệu gần tôi” (multisearch near me) cũng được phát triển như một tính năng bổ trợ, cho phép bạn chụp ảnh một vật không quen thuộc, chẳng hạn như một món ăn hoặc một loại cây trồng, sau đó tìm thấy nó ở địa điểm gần đó, chẳng hạn như nhà hàng hoặc tiệm làm vườn. Chúng tôi sẽ bắt đầu tung ra “Tìm Kiếm Đa Dữ Liệu gần tôi” bằng tiếng Anh ở Mỹ vào mùa thu này.

(Chẳng hạn, để dùng Tìm Kiếm Đa Dữ Liệu tìm kiếm một chiếc cà vật có màu sắc và hoa văn như một chiếc áo nào đó, bạn dùng Google Lens chụp hình chiếc áo đó rồi gõ văn bản “cà vạt” vào công cụ Google Search để tìm các nơi có bán mẫu cà vạt mà mình đang tìm.)

Hiểu cả thế giới qua công cụ dịch thuật Google Translate

Khi nhận thấy rằng ngôn ngữ hình ảnh có thể dễ dàng truyền đạt thông tin đến bất kỳ đối tượng nào, chúng tôi đã nỗ lực để hiện thực hóa việc “phiên dịch” hình ảnh trên Google Ống Kính với sự tiến bộ của AI. Người dùng vốn đã sử dụng Google để phiên dịch văn bản trên hình ảnh hơn 1 tỷ lần mỗi tháng, với trên 100 ngôn ngữ khác nhau – để họ có thể đọc thông tin ở mặt tiền cửa hàng, menu, bảng hiệu, …

Nhưng đôi khi, ý nghĩa lại thay đổi tùy thuộc vào ngôn ngữ và ngữ cảnh sử dụng, như ảnh nền chẳng hạn. Thay vì chỉ đơn thuần che đi văn bản gốc, chúng tôi đã có thể tái tạo các điểm ảnh nhằm cho ra một hình nền khớp với nguyên bản, và đặt bản phiên dịch lên phần hình nền đó để cho ra một giao diện trông tự nhiên hơn thông qua công nghệ máy học (machine learning) có tên là mạng đối nghịch tạo sinh (Generative Adversarial Networks – còn được biết đến là GANs). Nên nếu bạn đưa máy ảnh đến một tạp chí ở ngôn ngữ khác, bạn sẽ thấy phần văn bản được dịch đặt trên một ảnh nền phía sau.

Khám phá thế giới với chế độ xem đắm chìm

Chúng tôi đang tiến hành đưa những cải tiến mới nhất từ công nghệ thị giác máy tính (computer vision) và mô hình dự đoán (predictive model) vào ứng dụng Bản Đồ Google Maps. Cụ thể hơn, bản đồ 2D sẽ được nâng cấp thành chế độ xem đa chiều – cho phép bạn hòa mình với không gian tưởng chừng như bạn đang thực sự ở đó.

Sau thành công của tính năng cập nhật tình hình giao thông trực tiếp trên Google Maps, chúng tôi đã tạo ra một nâng cấp đáng kể khác trong việc lập bản đồ, đó là mang đến những thông tin hữu ích – như thời tiết và mức độ bận rộn của một địa điểm – với chế độ xem đắm chìm (immersive view) trong Google Maps. Qua trải nghiệm mới này, bạn có thể đưa ra cảm nhận sơ bộ về một địa điểm trước khi đến; từ đó, bạn có thể tự tin quyết định nên đi đâu, vào thời gian nào.

Giả sử bạn muốn gặp một người bạn tại nhà hàng, chỉ cần phóng tầm nhìn vào khu vực lân cận và nhà hàng để biết được tình hình của địa điểm đó vào một thời gian cụ thể bạn đã định trước, dự đoán tình hình thời tiết và tìm hiểu xem liệu nơi đó có đông không. Bằng cách kết hợp hình ảnh tiên tiến của Google về thế giới với các mô hình dự đoán, chúng tôi có thể cho bạn cảm nhận về không khí của một địa điểm sẽ như thế nào vào ngày mai, tuần tới hoặc thậm chí là tháng tới. Chúng tôi đang mở rộng phiên bản mới này với cảnh quan trên không của 250 địa danh vào ngày hôm nay và chế độ xem đắm chìm sẽ đến với 5 thành phố lớn khác trong những tháng tới. Nhiều địa danh khác cũng đang được nghiên cứu để triển khai.

Những công bố này, cùng với nhiều thông báo khác được công bố tại sự kiện Search On 22,  là khởi đầu cho quá trình chúng tôi chuyển đổi sản phẩm của mình để giúp bạn vượt ra khỏi cách thức tìm kiếm truyền thống. Chúng tôi luôn giữ vững lập trường với mục tiêu tạo ra những sản phẩm công nghệ hữu ích với bạn và cuộc sống của bạn – để giúp bạn khám phá thông tin theo cách của riêng mình.

Prabhakar Raghavan – SVP

Chris Phillips – VP & General Manager of Geo at Google

Lilian Rincon – Senior Product Director, Shopping

Sophia Lin – Director & General Manager, Food Vertical

Tham khảo: Search outside the box: How we’re making Search more natural and intuitive.

PRABHAKAR RAGHAVAN, Senior Vice President, Google Search.

Nguồn do Google cung cấp.

TOPS IN THE WORLD

THAM KHẢO REVIEW

Cập nhật Đại Dịch COVID-19 Thế giới