Генеративная модель ИИ может реконструировать трехмерные медицинские изображения с гораздо меньшей дозой рентгеновского облучения
Хотя 3D КТ-сканирование обеспечивает детальные изображения внутренних структур, 1000–2000 рентгеновских лучей, полученных под разными углами во время сканирования, могут увеличить риск рака у уязвимых пациентов. КТ-сканирование с разреженным обзором, которое захватывает всего 100 или даже меньше рентгеновских проекций, радикально снижает воздействие радиации, но создает проблемы для реконструкции изображения.
Недавно контролируемые методы обучения — тип машинного обучения, который обучает алгоритмы с помощью маркированных данных — улучшили скорость и разрешение реконструкций изображений МРТ с недостаточной выборкой и КТ с разреженным обзором. Однако маркировка этих больших наборов данных для обучения требует много времени и средств.
Инженерные исследователи Мичиганского университета возглавили разработку новой структуры под названием DiffusionBlend, которая может эффективно работать с 3D-изображениями, что делает метод значительно более применимым к КТ и МРТ. Результаты опубликованы на сервере препринтов arXiv .
DiffusionBlend использует модель диффузии — самоконтролируемую технику обучения, которая изучает распределение данных заранее — для выполнения реконструкции 3D КТ с разреженным видом посредством апостериорной выборки. Исследование было представлено сегодня на конференции по системам обработки нейронной информации ( NeurIPS ) в Ванкувере, Британская Колумбия.
«Наш новый метод повышает скорость и эффективность, а также качество реконструкции, что имеет решающее значение для медицинской визуализации », — сказал Боуэн Сонг, докторант кафедры электротехники и вычислительной техники Мичиганского университета и один из первых авторов исследования.
DiffusionBlend изучает пространственные корреляции между группой соседних срезов 2D-изображения, называемых априорной диффузией 3D-патча, а затем объединяет оценки многосрезовых патчей для моделирования всего объема 3D-изображения КТ.
При тестировании на общедоступном наборе данных 3D-КТ-сканов с разреженной проекцией метод DiffusionBlend превзошел различные базовые методы, включая четыре диффузионных подхода в восьми, шести и четырех проекциях, обеспечив сопоставимое или лучшее качество вычислительного изображения.
«До сих пор требования к памяти и низкая вычислительная эффективность диффузионных моделей ограничивали их практическое применение. Наш подход преодолевает эти препятствия, делая шаг в правильном направлении», — сказал Лиюэ Шэнь, доцент кафедры электротехники и вычислительной техники UM и старший автор исследования.
Дальнейшее повышение практичности и ускорение методов позволило сократить время реконструкции КТ с помощью DiffusionBlend до одного часа, тогда как предыдущие методы требовали до 24 часов.
«Было удивительно, насколько можно ускорить процесс, не жертвуя качеством реконструкции. Мы сочли это очень полезным», — сказал Джейсон Ху, докторант кафедры электротехники и вычислительной техники UM и один из первых авторов исследования.
Методы глубокого обучения могут вносить ошибки, которые вызывают визуальные артефакты — тип галлюцинации ИИ, который создает изображение чего-то, чего на самом деле нет. Когда дело доходит до диагностики пациентов, визуальные артефакты быстро становятся большой проблемой.
Исследователи подавили визуальные артефакты посредством оптимизации согласованности данных, в частности, с помощью метода сопряженных градиентов, и измерили, насколько хорошо сгенерированные изображения соответствуют измерениям с помощью таких показателей, как отношение сигнал/шум.
«Мы все еще находимся на ранней стадии развития этого метода, но здесь есть большой потенциал. Я думаю, что принципы этого метода могут быть распространены на четыре измерения, три пространственных измерения плюс время, для таких приложений, как визуализация бьющегося сердца или сокращений желудка», — сказал Джефф Фесслер, заслуженный профессор электротехники и компьютерных наук имени Уильяма Л. Рута в UM и соавтор исследования.