Сейчас ваша корзина пуста!
Запрос клиента: «соберите новости по теме моего бизнеса, а chatGPT сделает рерайт»

И получится супер!
Однако в реальности обычно не все так радужно. У некоторых бизнесменов, взрощенных в перестроечные годы, есть вера в град на холме и запад и в данном случае они уверены, что если в рунете нет новостей на тему их сияющего, но в России плохо работающего бизнеса, то уж в западном интернете про это постоянно по 2-3 новости в день выходит.
И тяжело удовлетворить желания клиента, если данное положение вещей не получается объяснить. Т.е. что его бизнес — узкоспециализирован, что это не продажа модных юбок и аксессуаров, про которые каждая девчушка в своей соцсети выпускает новость раз в час, поэтому каждые два часа новостей новых не будет 🙂 Итого имеем трудный случай по созданию контента.
А хорошо решаемый вариант — это когда клиент просит генерировать контент из широко представленного в новостной ленте, и хотя бы чуть касающийся его бизнеса. Нужно только обеспечить техническое решение, чтобы этот новостной поток, обработанный чатом Гпт, шел в его соцсети, и добавлять пару слов про его бизнес, например в конце каждого поста ставить подпись с небольшой «рекламой».
Исходя этого возникает задачка собирать новострой контент прямо из поисковика. В этом есть свои преимущества и недостатки.
К плюсам я бы отнес такое:
- То что поисковик по этим ключевым словам находит. может быть релевантнее, «новее», чем по каким-то rss потокам с десятка новостных сайтов — они сами непонятно как и где свой контент берут.
- Можно тонко настраивать запрос: берем и добавляем ключевики, стоп-слова, стоп-сайты — с помоек не надо тянуть… и так далее. Пример запроса на тему моды, со стоп словами и списком сайтов, на которых не надо искать:
мода стиль модный бренд показ fashion брендовая одежда -дайджест -дефиле -site:instagram.com -site:youtube.com -site:vk.com -site:moda.ru -site:fb.com -site:sodamoda.ru -site:tiktok.com -site:facebook.com
- Ваще это круто, самоудовлетворение на высоте!
А минусы — у гугла, яндекса есть защиты. У яндекса вообще каптча, не вариант каждый раз ее обходить. У гугл просто так не парсит выдачу, нужно притворятся google chrome пользователем…
В связи с этим и появились мысли — а че, пойду в Байду, т.е. захотелось попробовать посмотреть новости в китайском поисковике.
Сразу с чем сталкиваешься — там тоже как и у гугл. защита и надо ставить что будто ты обычный пользователь. А на некоторых китайских сайтах user agent вообще пролезает только будто ты смотришь из Firefox 🙂
Что поражает, выдача адекватная запросу, ничего случайного не вставляется — а у гугла полно мусора бывает:

Все на чистом китайском языке! Можно перевести:

Главное, что после некоторых манипуляций с node.js VPS от бегет, установкой на нее скрипта с puppeteer можно и гугл, и байду сканить поисковую выдачу, хоть скока.
И n8n от байды выдает очень хороший список ссылок на сайты, по которым и хочется новость, в поисковом запросе:

Линки есть одинаковые, но это норм, в выдаче они повторяются. Можно выбрать и первые три уникальных довольно релевантны, подходят… Остается перевести и сформировать саммари!
Записал видео по данному вопросу, ч.1:
ч.2:
Прокомментировать в Телеграм: https://t.me/n8nhow
Подписаться на канал обучения n8n: https://t.me/n8ncoaching
