Google ra mắt mô hình AI Flash Gemini 2.0, hiện có thể truy cập được cho các nhà phát triển

Bitget App

Giao dịch thông minh hơn

MPOST2024/12/13 13:45

Theo:MPOST

Tóm lại Google ra mắt Gemini 2.0 Flash, mô hình AI thử nghiệm mới nhất trong nhóm Gemini, có hiệu suất nâng cao, khả năng nhập và xuất đa phương thức cùng các tính năng cải tiến dành cho nhà phát triển.

Công ty công nghệ Google đã công bố ra mắt Gemini 2.0, mô hình AI mới nhất trong gia đình Gemini, bắt đầu bằng phiên bản thử nghiệm có tên là Gemini 2.0 Flash.

Dựa trên thành công của Gemini 1.5 Flash, được các nhà phát triển ưa chuộng, Gemini 2.0 Flash mang lại hiệu suất được cải thiện trong khi vẫn duy trì thời gian phản hồi nhanh. Đáng chú ý, mô hình mới vượt qua 1.5 Pro trong các điểm chuẩn chính với tốc độ gấp đôi. Ngoài ra, Gemini 2.0 Flash giới thiệu các khả năng mở rộng, bao gồm hỗ trợ cho các đầu vào đa phương thức như hình ảnh, video và âm thanh, cũng như các đầu ra đa phương thức như văn bản được ghép nối với hình ảnh do AI tạo ra và âm thanh chuyển văn bản thành giọng nói (TTS) đa ngôn ngữ có thể điều khiển. Điều này Mô hình AI cũng có thể gọi các công cụ như Google Search, thực hiện thực thi mã và truy cập người dùngdefichức năng của bên thứ ba.

Hiện có sẵn cho các nhà phát triển thông qua API Gemini trong Google AI Studio và Vertex AI, phiên bản thử nghiệm của Flash 2.0 hỗ trợ đầu vào đa phương thức với đầu ra văn bản. Các tính năng nâng cao như chuyển văn bản thành giọng nói và tạo hình ảnh gốc có thể truy cập được đối với các đối tác truy cập sớm, với khả năng cung cấp rộng rãi hơn dự kiến vào tháng XNUMX cùng với các kích thước mô hình bổ sung.

Để hỗ trợ thêm cho các nhà phát triển trong việc tạo ra các ứng dụng tương tác, năng động, Google cũng giới thiệu Giao diện lập trình ứng dụng trực tiếp đa phương thức (API) mới. API này cho phép nhập dữ liệu phát trực tuyến âm thanh và video theo thời gian thực, cùng với khả năng tích hợp nhiều công cụ để kết hợp chức năng.

Bắt đầu từ hôm nay, người dùng trên toàn thế giới có thể dùng thử phiên bản thử nghiệm được tối ưu hóa cho trò chuyện của Gemini 2.0 Flash bằng cách chọn từ danh sách thả xuống mô hình trên nền tảng web dành cho máy tính để bàn và thiết bị di động. Mô hình này cũng sẽ có trên ứng dụng di động Gemini trong tương lai gần.

Google khám phá khả năng của Gemini 2.0 Flash thông qua các dự án nghiên cứu

Gemini 2.0 Flash giới thiệu các khả năng tiên tiến giúp tăng cường tương tác của người dùng, bao gồm lý luận đa phương thức, hiểu ngữ cảnh dài, xử lý hướng dẫn phức tạp, lập kế hoạch, gọi hàm hợp thành và tích hợp liền mạch với các công cụ gốc. Các tính năng này, kết hợp với độ trễ được cải thiện, hoạt động cùng nhau để tạo nền tảng cho thế hệ tự chủ mới Trải nghiệm AI .

Hiện nay, Google đang nghiên cứu cách các tác nhân AI có thể hỗ trợ mọi người thực hiện các nhiệm vụ trong thế giới thực thông qua các nguyên mẫu được thiết kế để nâng cao năng suất và hợp lý hóa quy trình làm việc. Các ví dụ bao gồm Dự án Astra được cập nhật, một sáng kiến nghiên cứu tập trung vào khả năng tiềm ẩn của một trợ lý AI phổ quát, Dự án Mariner mới, tái hiện lại các tương tác giữa con người và tác nhân, bắt đầu bằng các trải nghiệm dựa trên trình duyệt và Jules, một trợ lý mã hóa do AI điều khiển được tạo ra để hỗ trợ các nhà phát triển trong công việc của họ. Bằng cách sử dụng Gemini 2.0 Flash trong các dự án này, Google đã có thể đánh giá hiệu quả các khả năng của mình và đạt được kết quả nâng cao, làm nổi bật tiềm năng to lớn của mô hình mới.

Tuyên bố miễn trừ trách nhiệm: Mọi thông tin trong bài viết đều thể hiện quan điểm của tác giả và không liên quan đến nền tảng. Bài viết này không nhằm mục đích tham khảo để đưa ra quyết định đầu tư.

PoolX: Khóa để nhận token mới.

APR lên đến 12%. Luôn hoạt động, luôn nhận airdrop.

Khóa ngay!