14.05.2026: Нейросани едут сами

Трекер утверждает, что спал я 9 часов. Вот ещё бы так пару дней поспать, и мозг начнёт работать штатно. Или не начнёт. С ним сложно угадать, но так хотя бы будет шанс.

Новостей по 7d2d пока нет. Ботик бдит в пустоту.

Он не думает, он  использует алгоритм. Думать надо там, где алгоритмы не работают.

Кстати говоря! Вчера, угробив кучу часов на ИИ-агента, я понял важную деталь: даже сильные нейронки проигрывают простым алгоритмам. В моём случае это проявилось в агрегации таймлайнов.

Что за таймлайны. Ну вот пример:

319
00:22:49,180 --> 00:22:55,308
Так, давай везде ставить факелы.

320
00:22:55,308 --> 00:22:57,308
Ой, вот здесь лава, это опасно.

321
00:22:57,308 --> 00:22:59,308
А у нас даже ведерочка нету, понимаешь?

322
00:22:59,308 --> 00:23:04,740
Уходим, уходим, уходим.

323
00:23:04,740 --> 00:23:06,740
Уходим, уходим.

324
00:23:06,740 --> 00:23:09,740
Так, убегаем, бегом.

325
00:23:09,740 --> 00:23:11,740
Значит, смотри, что мне...

326
00:23:11,740 --> 00:23:13,740
Так, ты не бежишь за нами?

Допустим, нейросеть посчитала важным сегмент 320, и решила объединить сегменты 319-324 в один фрагмент.

Понять значимость сегмента она, пусть бы и кое-как, но может.

По сути ей нужно взять время начала сегмента 319 и время окончания 324-го, перевести их в секунды и выдать две цифры. Элементарно: 22*60+49 и 23*60+9.

Вместо этого она начинает галлюцинировать, и выдавать цифры от балды, но с шагом в 10 секунд. Не только локальные слабые модели так  обделались. Я проверял и на облачных, мощных.

Так что правило «никогда не пытаться автоматизировать хаос» работает и сейчас, когда казалось бы есть LLM.

Меняю концепцию!

Раз искусственная нейросеть не справляется, будем использовать органическую. Пусть ИИ обработает для неё данные, а промежуточную работу сделают алгоритмы и мозг.

Эксперимент обещал быть интересным, но оказался задолбательским. Я лишний раз убедился, что искусственный интеллект порою уж слишком искусственный. Ему бывает очень непросто что-то объяснить и получить именно тот результат, что требовался. Нужно наверное быть очень спокойным человеком. Профессионально спокойным.

Тянет на отдельную профессию. Если такая появится, я пожалуй в деле.

Что удалось сделать?

ИИ кушает видос, распознаёт текст и создаёт таймлайны по нему, чистит их от мусора, нарезает под каждый сегмент 4 кадра (чтобы видеть что там происходило), и из всего этого делает html-страничку, в которой я могу отредактировать субтитры любого сегмента.

Это пока всё, что он может.

На выходе у меня json с субтитрами из тех сегментов, которые я выбрал в таблице. По этому json-файлу даже можно сгенерировать видео. С субтитрами!

Но субтитры мне пока нравятся не очень.

Для того чтобы сделать видео используется отдельный батник и пара жестов.

Да, хотелось бы большей гибкости и прочее. НО! Оно работает.

Сделать хороший инструмент, это круто. Не круто потом его не использовать…

Рабочий день снова прошёл в нездоровом угаре. Надо что-то с этим делать…

Вечер. Готовлюсь к стриму.

В этот раз строю корпорацию в Майнкрафте. Надеюсь будет весело.

В принципе, было здорово. Это был ровный стрим, без сюрпризов и фейлов.

Зрителям такие не заходят.

После стрима поиграл ещё немного.

Опомнился в час ночи. Ну хоть не в два. И где-то глубоко в конфигах моей органической нейросети зреет мысль, что для наблюдения за её работой нужен отдельный человек. Или несколько. Профессионально спокойные, в белом. Я бы может даже и нанял, но ой как не хочется привлекать их внимание.

Напишите комментарий

Введите имя

Введите адрес электронной почты

Введите адрес вашего сайта

Нажмите эту кнопку, чтобы отправить комментарий.

Введите текст комментария