Нейросеть научили самостоятельно озвучивать панорамные фотографии.
Об этом сообщает Science Magazine.
Так, алгоритм сам добавляет реалистичные звуки окружения и конкретных объектов, которые находит на изображении и расставляет их в зависимости от расположения на снимке. Технология может понадобится для разработчиков виртуальной реальности.
Благодаря новой технологии создателям VR-игр и фильмов скоро придется озвучивать их вручную.
Ранее исследователи из Вашингтонского университета создали инструмент DeepSqueak, который позволяет автоматически идентифицировать, обрабатывать и сортировать писк мышей и крыс.