Google ra mắt công cụ AI có thể chuyển văn bản thành hình ảnh đẹp như được vẽ, chụp ngoài đời thực

Nguyễn_Cương

Well-Known Member
Tham gia
5/10/17
Bài viết
2,516
Được thích
2,309
4031 #1

Google mới đây đã công bố một sáng tạo hoàn toàn mới của công ty có tên "Imagen", một công cụ biến văn bản thành hình ảnh thông qua mô tả của người dùng cung cấp. Google tuyên bố nó có thể vượt qua DALL-E 2, một công cụ AI tạo hình ảnh từ văn bản khác. Công ty đã giới thiệu một số hình ảnh từ văn bản, không thể phủ nhận chúng cho thấy các chi tiết tinh tế, vô cùng gần với những gì mô tả nhưng hiện Imagen chưa được phát hành rộng rãi để sử dụng.

Công cụ AI chuyển văn bản thành hình ảnh được mô tả là có mức độ “mức độ hiện thực chưa từng có và mức độ hiểu biết sâu sắc về ngôn ngữ”. Công cụ này phải hiểu văn bản thông qua các mô hình ngôn ngữ khác nhau và được cho là dựa vào các thuật toán vô cùng phức tạp để thực hiện tạo hình ảnh có độ trung thực cao.


Google đã cung cấp hình ảnh và mẫu tác phẩm của Imagen, với nhiều phong cách khác nhau, từ bản vẽ đến tranh sơn dầu và CGI. Chúng được đi kèm với các từ và cụm từ được sử dụng để tạo ra chúng. Ví dụ, một mẫu có nội dung "một quả thanh long đeo đai karate trong tuyết", trong khi một mẫu khác có mô tả còn kỳ quái hơn "một cây xương rồng nhỏ đội mũ rơm và đeo kính râm trên sa mạc Sahara."

Những hình ảnh được tạo ra trông cực kỳ thực như thể chúng được tạo ra bởi một người thực. Tuy nhiên, Google nói rằng nó được thực hiện thông qua công nghệ xử lý AI bằng cách sử dụng những hình ảnh thật và tinh chỉnh nó theo cách tốt nhất có thể. Bằng cách hiểu mô tả văn bản được cung cấp, Imagen sẽ tạo ra một hình ảnh 64 x 64 pixel, thực hiện hai cải tiến và chuyển đổi hình ảnh thành một ảnh 1024 x 1024 pixel lớn hơn.


Bất chấp những báo cáo ấn tượng này từ nhóm nghiên cứu, việc tự mình dùng thử Imagen sẽ không thể thực hiện được vì Google chưa có ý định ra mắt công cụ này trên phạm vi toàn câu. Google có những lý do cho điều đó, chẳng hạn như những thách thức về đạo đức, nguy cơ tiềm ẩn của việc sử dụng sai mục đích, thành kiến xã hội, giới hạn của các công cụ. Nhóm nghiên cứu tóm tắt rằng với tất cả những thử thách này, Imagen vẫn chưa hoàn hảo khi tạo ra những hình ảnh liên quan đến con người.

Theo MSPoweruser
Xem thêm:
 
Sửa lần cuối:

Theo dõi Youtube

MSI Pulsating Power

Thành viên online

Không có thành viên trực tuyến lúc này

Quảng Cáo

Quảng Cáo

Có thể bạn quan tâm

Top Bottom