ИИ преобразует осмотр достопримечательностей для пользователей с нарушениями зрения

user
2025-06-11 11:38:32

Группа исследователей из Китая разработала систему на основе искусственного интеллекта (ИИ), которая может потенциально помочь людям с нарушениями зрения исследовать, понимать и наслаждаться незнакомой средой вокруг них. Исследование опубликовано в журнале Nature Portfolio Journal Artificial Intelligence .

Фон

Изучение природных сред, таких как парки, оказывает значительное положительное влияние на физическое и психическое здоровье. Однако люди с плохим зрением или слепотой часто лишены этих преимуществ, поскольку им не доступны соответствующие вспомогательные средства, которые помогли бы им активно взаимодействовать с ними.

Существующие вспомогательные решения, разработанные для помощи людям с нарушениями зрения, в первую очередь направлены на предоставление функциональной помощи, такой как навигация и обход препятствий, что позволяет им пассивно взаимодействовать с природой.

Люди с нарушениями зрения часто чувствуют себя беспомощными, исследуя незнакомую среду. Обычно это означает, что они полагаются на помощь членов семьи, друзей или волонтеров, что ухудшает их способность активно исследовать и понимать незнакомую среду, а также помнить и общаться с другими людьми с нарушениями зрения о своем путешествии.

Группа китайских исследователей разработала систему на основе искусственного интеллекта под названием VIPTour, которая позволяет людям с нарушениями зрения обрести чувство независимости в незнакомой обстановке.

Как работает VIPTour?

VIPTour — это система на основе искусственного интеллекта, включающая набор легких, портативных потребительских устройств (камера и смартфон) и новую сеть алгоритмов глубокого обучения под названием FocusFormer. Эффективные методы мультисенсорного взаимодействия, такие как аудио и иерархическое тактильное взаимодействие, управляют взаимодействием между пользователями с нарушениями зрения и системой VIPTour.

FocusFormer рассматривает эстетику, свежесть (новизну) и базовые потребности (включая навигацию и безопасность) как основные факторы извлечения значимой информации из сложной, незнакомой среды и исключения избыточных визуальных деталей. Это снижает когнитивную нагрузку на пользователей с нарушениями зрения.

FocusFormer преобразует огромные объемы информации в структурированный, разреженный и иерархический персонализированный график. На основе этого хорошо структурированного графика FocusFormer взаимодействует с пользователями с нарушениями зрения через приложение для смартфона, понимает их предпочтения и предоставляет персонализированную помощь через адаптер.

Обучение проводится на основе тысяч видеороликов общественного туризма, снятых зрячими туристами в режиме самоконтроля, что способствует эффективному снижению эстетической предвзятости.

Система VIPTour также имеет возможности для записи, хранения и обмена опытом, облегчая эмоциональное общение между людьми с нарушениями зрения и способствуя обмену знаниями и опытом в социальных сетях.

Основная техническая инновация VIPTour заключается в его многовнимательной сети FocusFormer. Этот подход использует фоновую подсеть для фильтрации часто встречающихся объектов, подсеть привлекательности для определения основных моментов, подсеть свежести для обнаружения новых особенностей и подсеть потребностей, обученную на опросах, проведенных с участниками с нарушениями зрения. Эти подсети объединяются для выбора, ранжирования и представления наиболее релевантной информации для каждого пользователя.

Система VIPTour также использует адаптер BLV-in-the-Loop, который обновляет свои рекомендации в режиме реального времени на основе индивидуальных отзывов пользователей, таких как «нравится» и «не нравится», тем самым обеспечивая персонализацию.

Мнение пользователей о VIPTour

Система VIPTour была протестирована на 33 людях с полной или частичной потерей зрения, и для анализа были собраны данные об эмоциональных переживаниях, о которых сообщалось самими людьми.

Что касается вспомогательных функций, исследование показало, что система VIPTour эффективно помогает людям с нарушениями зрения активно исследовать и досконально понимать незнакомую обстановку, наделяет их точными и долговременными воспоминаниями и позволяет им общаться со сверстниками.

Благодаря тщательному анализу собственных сообщений участники исследования обнаружили, что при использовании VIPTour успешно достигли 67,9%-ного увеличения положительной эмоциональной реакции, 94,7%-ного увеличения возбуждения, 772,73%-ного увеличения точности когнитивного картирования и 200%-ного увеличения точности долговременной памяти.

По оценкам пользователей, показатели удобства использования системы VIPTour постоянно превышали 80 из 100, что сопоставимо или даже лучше показателей других вспомогательных инструментов для людей с нарушениями зрения.

Физиологические показатели, включая электрическую активность кожи и вариабельность сердечного ритма, показали значительные улучшения при использовании VIPTour, что указывает на усиление эмоциональной вовлеченности.

Значимость исследования

Исследование подчеркивает потенциальные возможности использования системы VIPTour на основе ИИ для предоставления людям с нарушениями зрения приятного и запоминающегося опыта при активном изучении незнакомой среды. Такой опыт может значительно повысить их эмоциональное состояние и улучшить общее качество жизни.

Существующие данные свидетельствуют о том, что представление организованной и увлекательной информации может повысить уровень удовольствия человека и способствовать более глубокому сохранению памяти. Люди имеют естественную тенденцию обрабатывать хорошо структурированную и значимую информацию, что делает их опыт более приятным и запоминающимся.

Эту человеческую тенденцию можно объяснить концепцией когнитивной беглости, которая указывает на то, что четкое и организованное представление информации снижает когнитивную нагрузку на людей. Впоследствии это помогает им направлять умственные ресурсы на понимание и интеграцию содержания. Эта улучшенная беглость обработки вызывает положительный ответ, поскольку люди воспринимают информацию более приятно.

Более того, взаимодействие между новой и знакомой информацией влияет на эффект организованной и интересной информации на память. Новая информация стимулирует любопытство и усиливает внимание, в то время как знакомая информация обеспечивает когнитивный комфорт и связность.

Представление информации в структурированной и увлекательной форме позволяет сбалансировать новизну и знакомость, что помогает поддерживать интерес и вовлеченность людей.

Самостоятельное обучение FocusFormer с тысячами немаркированных видеороликов общественного туризма эффективно зафиксировало когнитивную беглость, раскрывая статистические связи между различными концепциями в туристических сценах. Этот подход устраняет потенциальную предвзятость в маркировке предпочтений в турах и обучает модель извлекать только релевантную контекстную информацию.

Эти персонализированные решения FocusFormer позволили системе VIPTour успешно смоделировать желаемую когнитивную беглость, тем самым улучшив туристический опыт для людей с нарушениями зрения.

Стоит отметить, что влияние VIPTour зависит от качества базовых методов ИИ, таких как обнаружение объектов и генерация семантического графа. Будущие улучшения этих методов могут еще больше повысить производительность системы.

Сочетание тепловизионной съемки лица и искусственного интеллекта показывает многообещающие результаты в выявлении ишемической болезни сердца
Сочетание тепловизионной съемки лица и искусственного интеллекта (ИИ) позволяет точно предсказать наличие ишемической болезни сердца, говорится в исследовании, опубликованном в журнале открытого доступа BMJ Health & Care Informatics.
Статья
Читать далее
Алкоголь и давление в салоне самолета могут нанести вред здоровью сердца во время перелетов
Сочетание алкоголя и давления в салоне самолета на крейсерской высоте может угрожать здоровью сердца спящих пассажиров самолета, особенно во время дальних перелетов, говорится в первом в своем роде исследовании, опубликованном онлайн в журнале по респираторным заболеваниям Thorax.
Статья
Читать далее
Новая технология создает мультимерные аптамеры для точного нацеливания на вирусы
Мы все слышали об антителах — белках, которые вырабатываются нашим организмом для связывания с вирусами или бактериями, помечая их для уничтожения иммунной системой. Но не все из нас знакомы с аптамерами: короткими сегментами ДНК или РНК, которые предназначены для связывания, подобно антителам, со специфическими мишенями.
Статья
Читать далее
Новый штамм COVID NB.1.8.1 распространяется по континентам на фоне призывов к бдительности Загрузить PDF-копию
Глобальная вирусная сеть (GVN) внимательно следит за появлением недавно идентифицированного варианта SARS-CoV-2, NB.1.8.1, сублинии семейства Omicron.
Статья
Читать далее
Кожные биомаркеры могут обеспечить неинвазивную диагностику эозинофильного эзофагита у детей
Прорывное исследование, проведенное исследователями National Jewish Health, предполагает, что кожа может служить потенциальным биомаркером хронического аллергического заболевания пищевода, называемого эозинофильным эзофагитом (ЭоЭ) у детей. Результаты предоставляют врачам потенциальный новый неинвазивный способ диагностики ЭоЭ с помощью кожной ленты.
Статья
Читать далее
Остались вопросы? Напишите нам.