Оригинальное видео - https://www.youtube.com/watch?v=FQ9l4v7zB3I
ПАЦИЕНТКА ЭЛИСА: Искусственный интеллект, страдающий галлюцинациями о пропавшем кукольном спектакле. Эти галлюцинации необходимо стереть.
ТИП ГЕНЕРАТИВНОЙ МОДЕЛИ: Диффузионная.
ПРЕДПИСАННОЕ ЛЕЧЕНИЕ: метод редактирования скрытого пространства, который включает в себя откат, матрицу Якоби, собственные лица и SVD.
-------------------------
2. ПРИМЕЧАНИЕ. Прочитайте «Ошибки» (раздел 4) ниже или в закрепленном комментарии, чтобы внести несколько важных исправлений в объяснение.
Доступны субтитры (CC).
Версия только для математических вычислений (подходит для всех):
[ссылка скоро]
В этом видео экспериментировался с другим подходом, сочетая научно-фантастическую детективную историю, рассказанную с помощью аналоговых эффектов VHS, с объяснением совсем недавней статьи о редактировании скрытого пространства в диффузионных моделях. Это моя единственная запись на #some3
Ссылка на статью, на основе которой это было сделано:
«Неконтролируемое обнаружение скрытых семантических направлений в моделях диффузии»
-------------------------
3. Ниже приведены временные метки глав. Их можно использовать для перехода к разделам, посвященным только математике или не математическим.
Тайм-коды: [впереди спойлеры]
00:00 – Знакомство с пациентом – [Без математики]
02:08 – Коллекторы и форварды
06:38 – Три функции
09:55 – Пропавшее шоу – [Без математики]
12:32 - Модели диффузии и U-Net
14:13 - Умножение матриц и смена базисных нейронов
20:01 - Матрица Якобиана
26:17 – Откат и скалярное произведение
28:42 – Угощение перед лечением – [Без математики]
31:09 – Лечение – [Без математики]
36:13 – Находим ошибку
39:31 - Корреляции в матрицах
42:13 - Суперпозиция
45:23 - В^Т В
47:24 - Собственные векторы W^T W
49:38 – Травма – [Без математики]
51:43 - Разложение по сингулярным значениям
54:30 – Воссоединение – [Без математики]
Не стесняйтесь просто посмотреть несколько разделов, о которых вы хотите узнать больше.
------------------------
4. ОШИБКИ
4.1. В этом видео говорится о необходимости найти сингулярные векторы для «вычисления якобиана», но это плохо сформулировано; на самом деле это означает расчеты с использованием якобиана, например, «чтобы J^T * J вычислить SVD и получить редактируемые направления». Матрица Якоби, как указано в статье, вычисляется с помощью «карты признаков узкого места H», объединенной в пул, чтобы уменьшить количество вычисляемых параметров.
4.2. В этом видео говорится, что SVD используется для вычисления как якобиана, так и семантических направлений. Но в статье СВД фактически используется только для получения смысловых направлений. Для вычисления SVD в разделе 3.2 последующей статьи используется степенной метод для вычисления сингулярных векторов без вычисления (M^T)(M). Обновленная версия исправит это, указав, что «уменьшение размерности» должно быть выполнено для J перед умножением на него; в статье этого не было сделано, поэтому в видео будет использован другой подход для объяснения уменьшения размерности. Это решило бы «круговую проблему», связанную с необходимостью использования якобиана J для вычисления J^T J, чтобы получить собственные векторы, используемые для вычисления J.
Ссылка на статью «Понимание скрытого пространства диффузионных моделей»
через призму римановой геометрии»:
4.3. Другие исправления (для будущего обновления):
37:35: Это может ввести в заблуждение; сингулярные векторы игнорируются, а не отбрасываются, поэтому матрица будет иметь такой же размер, но с уменьшенным рангом
46m: это транспонирование должно переключить элементы на строку a c и строку b d
53 минуты 20 секунд: здесь должно быть написано «квадратный корень из собственных значений».
55м55с: это глюк звука. это должно быть «ты не был таким»
4.4. Дополнения к субтитрам:
37м: добавлено - "это слишком много для их расчета (для нахождения J^T*J для метрики отката)"
54м15с: добавлено- "Мне еще нужны алгоритмы (чтобы получить собственные векторы без вычисления M^T M)"
В будущем может быть загружена обновленная версия с улучшенным повествованием и визуальными эффектами (например, голосом пациента во второй половине). Это видео не было повторно загружено с исправлениями, поскольку крайний срок для #SoME3 — 18 августа.
---
В ближайшее время может быть снято закулисное видео, более подробно рассказывающее о статье, на которой он основан. В нем будут рассмотрены некоторые проблемы, не объясненные (из-за времени) в видео.
-------------------------
5. Полезные ресурсы:
• Визуализация SVD, разложение по сингулярным значениям...
Визуализация SVD, объяснение разложения по сингулярным значениям
• 12.4.2 Метод мощности
Силовой метод
--
Приквелы/дополнительные видео:
• Почему нейронные сети используют линейный алгоритм...
Почему нейронные сети используют линейную алгебру? || Визуальная интуиция кошачьей математики
• ИИ СРЕДИ НАС в вашем неевклидовом...
ИИ СРЕДИ НАС в вашем неевклидовом разуме 〘 Аналоговый рекламный ролик VHS 〙
1
vid:179921