Apple ra mắt mẫu AI có thể chỉnh sửa hình ảnh từ văn bản

Mr.X

Well-Known Member
Tham gia
28/8/22
Bài viết
1,851
Được thích
88
721 #1

Apple không phải là một trong những công ty hàng đầu trong lĩnh vực AI hiện nay, nhưng mô hình AI nguồn mở mới để chỉnh sửa hình ảnh của công ty cho thấy những gì họ có thể đóng góp cho lĩnh vực này.

Mô hình được gọi là Chỉnh sửa hình ảnh có hướng dẫn (MGIE), sử dụng các mô hình ngôn ngữ lớn đa phương thức (MLLM) để diễn giải các lệnh dựa trên văn bản khi thao tác với hình ảnh. Nói cách khác, công cụ này có khả năng chỉnh sửa ảnh dựa trên văn bản mà người dùng nhập vào. Mặc dù đây không phải là công cụ đầu tiên có thể làm như vậy nhưng "các hướng dẫn của con người đôi khi quá ngắn gọn để các phương pháp hiện tại có thể nắm bắt và làm theo", dự án cho biết.

Công ty đã phát triển MGIE cùng với các nhà nghiên cứu từ Đại học California, Santa Barbara. MLLM có khả năng chuyển đổi các lời nhắc văn bản đơn giản hoặc mơ hồ thành các hướng dẫn chi tiết và rõ ràng hơn mà chính trình chỉnh sửa ảnh có thể làm theo. Ví dụ: nếu người dùng muốn chỉnh sửa ảnh bánh pizza pepperoni để "làm cho nó healthy hơn", MLLM có thể hiểu ảnh đó là "thêm rau củ bên trên" và chỉnh sửa ảnh như vậy.


Ngoài việc thay đổi, thực hiện những thay đổi lớn đối với hình ảnh, MGIE còn có thể cắt, thay đổi kích thước và xoay ảnh cũng như cải thiện độ sáng, độ tương phản và cân bằng màu sắc, tất cả đều thông qua văn bản. Nó cũng có thể chỉnh sửa các khu vực cụ thể của ảnh và chẳng hạn như có thể sửa đổi tóc, mắt và quần áo của người trong ảnh hoặc xóa các thành phần trong nền.

Apple đã phát hành mô hình này thông qua GitHub, nhưng những người quan tâm cũng có thể dùng thử bản demo hiện được lưu trữ trên Hugging Face Spaces. Apple vẫn chưa cho biết liệu họ có kế hoạch sử dụng những gì học được từ dự án này thành một công cụ hoặc một tính năng mà hãng có thể tích hợp vào bất kỳ sản phẩm nào của mình hay không.
 
Top Bottom