Я шукаю genAI, де ви вводите зображення та повідомляєте його 看图写话 (подивіться на зображення та напишіть), і він описує зображення, тобто перетворення зображення в текст. Я хотів би використовувати його для практики мови.
Я знайшов astica та CLIP Interrogator, який працює для англійської мови. І VisualGLM раніше працював для китайської мови, але тепер він просто каже:
超时!请稍等几分钟再重试。
Тайм-аут! Зачекайте кілька хвилин і повторіть спробу.
Питання: чи існує genAI, який може описати вхідне зображення китайською мовою?