Медичний чат-бот перевершив лікарів у точності діагностики під час віртуальних консультацій
Оновлена версія медичного чат-бота Articulate Medical Intelligence Explorer (AMIE) від Google підвищила діагностичну точність в аналізі деяких медичних зображень. Як повідомляє Nature із посиланням на препринт дослідження на arXiv, AMIE перевершив лікарів у тлумаченні фотографій шкірних висипань, електрокардіограм та лабораторних аналізів у форматі PDF. Варто зазначити, що стаття ще не пройшла наукового рецензування.
Для перевірки можливостей нової версії чат-бота було проведено віртуальні консультації: 25 акторів моделювали 105 клінічних сценаріїв, звертаючись як до AMIE, так і до лікарів первинної ланки. Ці сценарії охоплювали різноманітні симптоми, історії хвороб та відповідні медичні зображення.
Після кожної консультації як чат-бот, так і лікар пропонували діагноз і план лікування. Результати оцінювала група з 18 фахівців у галузях дерматології, кардіології та внутрішньої медицини. Експерти аналізували стенограми консультацій і підсумкові звіти.
Загалом чат-бот AMIE продемонстрував вищу точність у постановці діагнозів порівняно з лікарями, а на його ефективність менше впливала низька якість вхідних зображень.
Вдосконалений чат-бот працює на основі великої мовної моделі (large language model, LLM) Gemini 2.0 Flash від Google, здатної обробляти візуальну інформацію. Дослідники адаптували модель для медичних потреб, додавши алгоритм, що покращує її здатність до діагностичних діалогів.
Щоб довести переваги нової системи над базовою версією Gemini 2.0, дослідники створили симуляції діалогів між пацієнтом і лікарем, у яких AMIE виконувала всі три ролі: пацієнта, лікаря та незалежного оцінювача. «Такий підхід дозволяє моделі навчитися бажаній поведінці під час діагностичних розмов», — пояснює Рютаро Танно, науковець Google DeepMind і співавтор дослідження.
За словами Танно, цей метод суттєво відрізняється від попередніх підходів, які вимагали перенавчання моделей на спеціалізованих базах даних. Новий підхід є менш затратним і потенційно доступнішим для широкого впровадження.
Водночас дослідники наголошують, що змодельовані сценарії не можуть повністю відтворити складність реальної клінічної практики: «Лікарі мають досвід, інтуїцію та можливість провести фізичний огляд пацієнта — усе це важко відтворити в симуляції». Хоча результати дослідження виглядають «обнадійливо», практична цінність цієї технології поки що залишається невизначеною, а її впровадження в реальну медичну практику буде непростим завданням.
Джерела:
- Google AI better than human doctors at diagnosing rashes from pictures | Nature.com