Сейчас ваша корзина пуста!
Крутая задача, которую сейчас одному мне не выполнить… печаль

Итак, сейчас основной источник клиентов у меня сайт ПРОФИ, на нем иногда встречаются очень интересные задачи. И встретилась мне вот это задание, которое сразу же вызвало любопытство и желание выполнить:

Пожелания и особенности: Разработать систему для Парсинга файлов любого формата.
Необходимо парсить прайс листы по стройматериалам и передавать информация согласно структуре в sql.
Прайсы разного вида иногда без четкой структуры табличной части.
Кто действительно силен в этом — пишите, скину ссылку на примеры прайс листов.
Я отозвался. В профи, когда пишешь отклик, необходимо указать стоимость выполнения задачи, ориентир хотя бы. Я прикинул — ну парсинг, даже не сайтов, написал от 15000. А когда мне клиент скинул примеры файлов, и я не пару посмотрел — а ВСЕ, то был так сказать шокирован своим первоначальным настроем по отношению к решению данной задачи.
Файлов оказалось 60 штук, «прайс-листы». Я посмотрел первые попавшиеся, формат оказался эксель, вроде даже строго структурировано всё:


Встречалась и полная муйня:

На подобное подумал: грузить в чатгопоту — ChatGPT, и выспрашивать у него форматы строк, запоминать их в БД, а потом, имея эти форматы, парсить содержимое всех файлов. Главное набрать все варианты строк с помощью ИИ.
Однако затем клиент написал, что на самом деле эксель тут только 30%, а большая часть в виде pdf и есть просто изображения…
Глянул повнимательнее:

В принципе, для ChatGPT и это не проблема, только разбирать сами pdf это уже не эксель, а полностью доверять парсить целиком файлы через ChatGPT — в принципе можно, но сколько это денег съест… Я даже не прикинул. Ибо клиент озвучил — о там может быть 1000 файлов… Их все надо обрабатывать…
И у меня просело внутри от «бездны» — какие тут 15000 рублей, это задача от 100000 начинается. Мне одному не выполнить — как управленец проектами после тщательного погружения в условия задачи пришло понимание, какие требуются ресурсы — а у меня их сейчас нет. Особенно времени: параллельно веду другие проекты, причем выполнение их не может быть ни отменено, ни отложено.
Честно написал клиенту:

Я направил его к команде, которая занимается парсингом, серьезные ребяты — вот они точно справятся с такой задачей, от скольки они запросят за решение — ну не менее 50000 на первоначальном этапе, а затем поддержка ежемесячная. Потому что этот проект не разовый — а требует именно поддержки, абонентского обслуживания системы парсинга-структурирования и сбора данных.

Прокомментировать в Телеграм: https://t.me/n8nhow
Подписаться на канал обучения n8n: https://t.me/n8ncoaching
