14.05.2026: Нейросани едут сами
Трекер утверждает, что спал я 9 часов. Вот ещё бы так пару дней поспать, и мозг начнёт работать штатно. Или не начнёт. С ним сложно угадать, но так хотя бы будет шанс.
Новостей по 7d2d пока нет. Ботик бдит в пустоту.
Он не думает, он использует алгоритм. Думать надо там, где алгоритмы не работают.
Кстати говоря! Вчера, угробив кучу часов на ИИ-агента, я понял важную деталь: даже сильные нейронки проигрывают простым алгоритмам. В моём случае это проявилось в агрегации таймлайнов.
Что за таймлайны. Ну вот пример:
319 00:22:49,180 --> 00:22:55,308 Так, давай везде ставить факелы. 320 00:22:55,308 --> 00:22:57,308 Ой, вот здесь лава, это опасно. 321 00:22:57,308 --> 00:22:59,308 А у нас даже ведерочка нету, понимаешь? 322 00:22:59,308 --> 00:23:04,740 Уходим, уходим, уходим. 323 00:23:04,740 --> 00:23:06,740 Уходим, уходим. 324 00:23:06,740 --> 00:23:09,740 Так, убегаем, бегом. 325 00:23:09,740 --> 00:23:11,740 Значит, смотри, что мне... 326 00:23:11,740 --> 00:23:13,740 Так, ты не бежишь за нами?
Допустим, нейросеть посчитала важным сегмент 320, и решила объединить сегменты 319-324 в один фрагмент.
Понять значимость сегмента она, пусть бы и кое-как, но может.
По сути ей нужно взять время начала сегмента 319 и время окончания 324-го, перевести их в секунды и выдать две цифры. Элементарно: 22*60+49 и 23*60+9.
Вместо этого она начинает галлюцинировать, и выдавать цифры от балды, но с шагом в 10 секунд. Не только локальные слабые модели так обделались. Я проверял и на облачных, мощных.
Так что правило «никогда не пытаться автоматизировать хаос» работает и сейчас, когда казалось бы есть LLM.
Меняю концепцию!
Раз искусственная нейросеть не справляется, будем использовать органическую. Пусть ИИ обработает для неё данные, а промежуточную работу сделают алгоритмы и мозг.
Эксперимент обещал быть интересным, но оказался задолбательским. Я лишний раз убедился, что искусственный интеллект порою уж слишком искусственный. Ему бывает очень непросто что-то объяснить и получить именно тот результат, что требовался. Нужно наверное быть очень спокойным человеком. Профессионально спокойным.
Тянет на отдельную профессию. Если такая появится, я пожалуй в деле.
Что удалось сделать?
ИИ кушает видос, распознаёт текст и создаёт таймлайны по нему, чистит их от мусора, нарезает под каждый сегмент 4 кадра (чтобы видеть что там происходило), и из всего этого делает html-страничку, в которой я могу отредактировать субтитры любого сегмента.
Это пока всё, что он может.
На выходе у меня json с субтитрами из тех сегментов, которые я выбрал в таблице. По этому json-файлу даже можно сгенерировать видео. С субтитрами!
Но субтитры мне пока нравятся не очень.
Для того чтобы сделать видео используется отдельный батник и пара жестов.
Да, хотелось бы большей гибкости и прочее. НО! Оно работает.
Сделать хороший инструмент, это круто. Не круто потом его не использовать…
Рабочий день снова прошёл в нездоровом угаре. Надо что-то с этим делать…
В принципе, было здорово. Это был ровный стрим, без сюрпризов и фейлов.
Зрителям такие не заходят.
После стрима поиграл ещё немного.
Опомнился в час ночи. Ну хоть не в два. И где-то глубоко в конфигах моей органической нейросети зреет мысль, что для наблюдения за её работой нужен отдельный человек. Или несколько. Профессионально спокойные, в белом. Я бы может даже и нанял, но ой как не хочется привлекать их внимание.
Напишите комментарий