Kính AR sẽ được kích hoạt bằng AI trong tương lai gần

Những tiến bộ của Ai đang dần thống trị cuộc sống. Các ứng dụng của AI dường như là vô hạn và không có gì ngạc nhiên khi nó sẽ biến đổi thế giới của chúng ta và cách chúng ta tương tác với nó. Cùng với nhiều ngành công nghiệp khác, điều đó đặc biệt áp dụng cho thực tế tăng cường.

Các mô hình AI đã được sử dụng để xây dựng trải nghiệm AR phong phú, đặc biệt là trên các ứng dụng dành cho thiết bị di động. Các lĩnh vực thực tế tăng cường và trí tuệ nhân tạo đang phối hợp với nhau để tạo ra những trải nghiệm trực quan, độc đáo, kết hợp nhuần nhuyễn hơn giữa thế giới thực và thế giới kỹ thuật số. Biên giới tiếp theo trong phát triển AI và AR là triển khai các khả năng AI tiên tiến vào kính AR của người tiêu dùng để mở rộng khả năng tương tác đắm chìm.

AI sáng tạo sẽ đẩy nhanh việc tạo ra thế giới 3D  tạo ra khả năng vô hạn cho người đeo để tạo ra thực tế của riêng họ

Kính AR
Hình ảnh được tạo bởi AI

AI sáng tạo có những tiến bộ trong thuật toán, mô hình ngôn ngữ và sức mạnh xử lý tăng lên sẵn có để chạy các phép tính cần thiết nhằm lập bản đồ và tương tác với thế giới thực.

Cho đến nay, có những hạn chế đối với các mô hình 3D trong kính AR vì về cơ bản chúng là thủ công. Tuy nhiên, AI sáng tạo sẽ tạo ra những thứ này rất nhanh chóng và tự động. AI sáng tạo trong kính AR sẽ giúp xây dựng các mô hình 3D nhanh hơn, khai thác toàn bộ tiềm năng của AR. Việc tạo ra thế giới kỹ thuật số này, để phủ lên thế giới vật chất, sẽ nhanh hơn, đầy đủ hơn và hấp dẫn hơn mà không cần lao động thủ công chuyên sâu.

AI sáng tạo cũng sẽ thay đổi trải nghiệm người dùng và cách chúng ta tương tác với không gian vật lý. Với kính AR hỗ trợ AI Sáng tạo, người đeo có thể biến trí tưởng tượng của họ thành thế giới thực theo đúng nghĩa đen. Không cần mã hóa, người đeo có thể sử dụng tính năng nhận dạng giọng nói để ‘nói’ hình ảnh và vật thể 3D của họ qua kính AR chính xác theo cách họ muốn. Họ có thể nói: “hãy tưởng tượng có một con cá heo đang bơi trong phòng” – và nó sẽ xuất hiện trước mặt họ. Cơ hội cho sự đắm chìm này hầu như là vô hạn đối với giải trí, công việc và hơn thế nữa.

Kính AR sử dụng Trí tuệ nhân tạo Sáng tạo cũng sẽ thay đổi thế giới trò chơi để tạo ra trải nghiệm chơi trò chơi đắm chìm và cá nhân hóa hơn rất nhiều. Ví dụ: với ChatGPT, việc tạo các nhân vật thực tế hơn và thêm các nhiệm vụ hoặc thế giới trò chơi mới sẽ dễ dàng hơn. Nó cũng có thể được sử dụng để cải thiện trải nghiệm chơi trò chơi bằng cách phân tích hành vi của người chơi và làm cho trò chơi trở nên dễ dàng hơn hoặc khó khăn hơn đối với người chơi trong thời gian thực, tùy chỉnh trải nghiệm một cách tự động.

Dịch lời nói + văn bản được hỗ trợ bởi AI sẽ giảm rào cản ngôn ngữ

Nhận dạng giọng nói tự động (ASR) sử dụng tính năng nhận dạng giọng nói nghe nhìn của mạng thần kinh (một thuật toán dựa trên quá trình xử lý hình ảnh để trích xuất văn bản). Điều này có thể dịch văn bản viết – như văn bản trên thực đơn ở nước ngoài – sang ngôn ngữ mẹ đẻ của bạn trong thời gian thực.

Khi được áp dụng trong kính AR, nó có thể cung cấp phụ đề theo thời gian thực bằng ngôn ngữ mẹ đẻ của bạn khi ai đó đang nói bằng ngôn ngữ khác – tất cả đều nằm trong khung kính AR của bạn. Điều này giúp loại bỏ sự thất vọng của khách du lịch và doanh nhân đang cố gắng giao tiếp bằng ngôn ngữ địa phương và do đó thúc đẩy một thế giới giao tiếp và hợp tác hơn.

Nhận dạng và dịch văn bản kết hợp các kỹ thuật Nhận dạng ký tự quang học AI (OCR) với các công cụ dịch văn bản thành văn bản như DeepL. Các công cụ AI như Khuếch tán ổn định cũng có thể tăng cường khả năng giao tiếp của một người bằng hoạt ảnh hoặc các công cụ hỗ trợ trực quan khác có thể giúp truyền đạt các khái niệm phức tạp hoặc chi tiết. Điều này tăng cường mức độ tương tác của người dùng: một cặp kính AR sử dụng AI này có thể hiển thị hình ảnh hoặc video tương ứng trong thời gian thực có liên quan đến những gì người dùng đang nói trước mặt họ tại bảng điều khiển hoặc bản trình bày. Google gần đây đã trêu chọc việc phát triển kính AR với chức năng này.

Nó cũng cho phép cộng đồng người khiếm thính tham gia vào các cuộc trò chuyện hàng ngày mà không cần phải đọc nhép hoặc giao tiếp bằng mắt bằng cách ngay lập tức chuyển âm thanh thành phụ đề hiển thị trước mắt người đeo.

AI đang thể hiện sự hiện diện của nó trong y tế, giáo dục và nhiều lĩnh vực khác. Chúng ta sẽ sớm có kính AR thông minh, giống như khoa học viễn tưởng phổ biến, sẽ đưa mọi người vào môi trường thực tế ảo hoặc tăng cường, nơi AI nhanh chóng lập bản đồ phòng và vị trí của người nói để giúp giao tiếp ảo trở nên liền mạch và ít rườm rà hơn bất kể vị trí của một trong hai bên.

AI giúp kính AR dễ dàng phát hiện và gắn nhãn các đối tượng trong thế giới thực – tăng cường tương tác.

Các thuật toán mạng thần kinh chuyển đổi (CNN) trong phát hiện đối tượng hiện đang được sử dụng trong các thiết bị di động để ước tính vị trí và mức độ của các đối tượng trong một cảnh. Sau khi phát hiện một đối tượng, phần mềm AR có thể phủ văn bản lên đối tượng đó hoặc tạo một đối tượng khác vào thế giới thực và tạo ra sự tương tác giữa hai đối tượng. Các đối tượng được chuyển vào thế giới thực có nhiều ứng dụng bao gồm hướng dẫn, điều hướng, chế độ ăn uống và dinh dưỡng, v.v.

Ví dụ: khi đeo một cặp kính AR có các khả năng AI này, người dùng có thể đi bộ trên đường phố của bất kỳ thành phố nào và tìm hiểu về bất kỳ địa danh nào trong thời gian thực khi xem nó. Kính AR có thể xác định, gắn nhãn và cung cấp thông tin về thành phố cũng như các địa danh của nó – tất cả thông qua khung của người đeo. Khi công nghệ nhận dạng đối tượng được cải thiện, dữ liệu dinh dưỡng như calo, protein, chất béo và cholesterol của bất kỳ loại thực phẩm và khẩu phần nào sẽ có sẵn. Trong khi đó, mã QR đơn giản trên sản phẩm sẽ gợi ra chi tiết dinh dưỡng cho người dùng.

Ngoài khả năng phát hiện đối tượng thuần túy, phần mềm nhận dạng khuôn mặt cũng đang trở nên phổ biến để phát hiện người . Hiện tại, nhận dạng khuôn mặt đang phát triển trong ngành hàng không khi nhiều chuyến bay sử dụng công nghệ này để xác nhận danh tính của hành khách – thêm một lớp bảo mật bổ sung và đẩy nhanh quá trình lên máy bay. Nhận dạng khuôn mặt, khi được sử dụng trong kính AR, có thể mang lại khả năng nhận dạng cho người đeo ở mọi nơi. Ví dụ: trong tương lai gần với kính AR, bạn có thể gặp gỡ những người khác trên mạng xã hội và nhận thông tin cơ bản của họ ngay lập tức trước khi quyết định xem bạn muốn ‘kết bạn’ hay kết nối với họ.

Kính AR hỗ trợ AI đang thay đổi cuộc sống của chúng ta và hình ảnh cũng như khả năng của chúng sẽ tiếp tục được cải thiện. Trong thế giới ngày càng kết nối của chúng ta, chúng đang đơn giản hóa các nhiệm vụ và phá vỡ các rào cản mà chỉ vài năm trước đây người ta cho rằng không thể vượt qua. Những tiến bộ về trí tuệ nhân tạo đang diễn ra nhanh chóng đến mức trong 10 năm tới, AI sẽ đạt được nhiều tiến bộ hơn so với 50 năm trước đó. Cho dù đó là môi trường chính phủ, doanh nghiệp hay cá nhân, trí tuệ nhân tạo sẽ sớm hợp nhất với kính AR để hòa trộn môi trường vật lý và kỹ thuật số của chúng ta.