Очистка данных в Excel с ИИ
Содержание скрыть
7 Полная очистка. Процессы для удаления ссылок из текста и лишних слов

Если вы ищете способ удалить лишние слова из текста в Excel, удалить лишние символы из текста, выполнить нормализацию текста, удалить текст в скобках, удалить спецсимволы из текста или удалить ссылки из текста — эта статья для вас. Мы покажем, как за минуты очистить данные с помощью ИИ на нашей платформе CognitiveAI. Один процесс — одна задача, и вы избавитесь от рутины навсегда.


Кому полезно удалить лишние слова из текста и символы в повседневных задачах


  • Интернет-магазины: чистка названий товаров и описаний, удаление промо-слов “акция”, “скидка”, эмодзи.
  • Аналитики и маркетологи: убрать UTM, ссылки, хэштеги, нормализация текста перед сегментацией.
  • HR и продажи: очистить контакты, оставить только имена, должности, компании.
  • Любые команды, которые устали искать, как удалить лишний текст в экселе, и хотят перестать чистить данные вручную.

Что чистим удалить лишние символы из текста, текст в скобках и ссылки

  • Удалить лишние слова из текста: рекламные эпитеты, длинные приписки “скидка, акция”, дубли, вводные фразы.
  • Удалить лишние символы из текста: эмодзи, повторяющиеся знаки препинания, спецсимволы, лишние пробелы и переносы.
  • Нормализация текста: приводим к единому регистру, заменяем кавычки и дефисы на корректные, чистим неразрывные пробелы.
  • Удалить спецсимволы из текста: © ® ™, служебные символы, HTML-сущности.
  • Удалить ссылки из текста: http/https, www, короткие ссылки, телеграм-handles, социальные сети.
  • Извлечь или удалить телефоны, e-mail, ИНН/ОГРН, артикулы, SKU, коды.
  • Оставить только цифры или только буквы, убрать валюты и единицы измерений.
  • Очистить столбец от лишних тегов, хэштегов, обращений @, ID.

Как работает нормализация текста и очистка на CognitiveAI

  • Вы создаёте контейнер — рабочее пространство под конкретный файл.
  • Загружаете Excel или CSV (важно: платформа одинаково работает и с Excel, и с CSV; это ключевое преимущество — не нужно конвертировать).
  • Создаёте процессы. В процессе вы пишете промпт (описание задачи), а в текст подставляются “чанки” — данные из выбранных столбцов, которые у вас обозначаются как [A], [B], [C] и т. п. Один процесс — одна конкретная задача.
  • Запускаете и ждёте. Можно закрыть страницу — процесс завершится автономно. По готовности результат сохраняется в выбранный столбец (перезапись или новый столбец).
  • Скачиваете готовый Excel и/или CSV.

Подробнее про работу с Excel-таблицами с помощью ИИ


Пример файла для очистки данных из Excel

Представим реальный набор, который часто встречается в интернет-торговле и каталогах:

Столбцы:

  • [A] Название товара — “iPhone 13 Pro Max — ХИТ! ?? Супер цена (новинка 2022)”
  • [B] Описание — “Смартфон Apple. Память 256 ГБ. Цвет: графит. Подробнее: https://site.ru/p/123 (действует акция)”
  • [C] Компания — “ООО “ТехМаркет” (ИНН 7701234567, ОГРН 1207700123456)”
  • [D] Ссылка — “https://site.ru/product?id=123&utm_source=google&utm_medium=cpc”
  • [E] Цена — “89 990 руб.” или “89,990 RUB”
  • [F] Примечания — “Подробности в Telegram: t.me/techshop, звоните +7 (999) 123-45-67, #новинка”
  • [G] Категория — “Электроника/Смартфоны///Apple”
  • [H] Артикул — “SKU: IP13PM-256-GR (временно недоступно)”
  • [I] Адрес/Город — “Россия, г. Москва, ул. Тверская, д. 1 (м. Тверская)”
Название товара Описание Компания Ссылка Цена Примечания Категория Артикул Адрес/Город
iPhone 13 Pro Max — ХИТ! 💥 Супер цена (новинка 2022) Смартфон Apple. Память 256 ГБ. Цвет: графит. Подробнее: https://site.ru/p/123 (действует акция). ООО “ТехМаркет” (ИНН 7701234567, ОГРН 1207700123456) https://site.ru/product?id=123&utm_source=google&utm_medium=cpc 89 990 руб. Подробности в Telegram: t.me/techshop, звоните +7 (999) 123-45-67, #новинка. Электроника/Смартфоны///Apple SKU: IP13PM-256-GR (временно недоступно) Россия, г. Москва, ул. Тверская, д. 1 (м. Тверская)
Ноутбук Lenovo IdeaPad 5 — ТОП ПРОДАЖ! 💻 Мощный ноутбук для работы и учебы. Процессор Intel Core i5, 16 ГБ ОЗУ, SSD 512 ГБ. Спецпредложение тут: https://bestshop.com/lenovo_sale ИП Иванов И.И. ИНН 500123456789 ОГРН 315500100012345 https://bestshop.com/laptops/lenovo-ideapad 55,500 RUB Бесплатная доставка по городу. Звоните по номеру +7 (495) 111-22-33. Электроника/Компьютеры/Ноутбуки///Lenovo LN-IP5-i5-16G-512S; Склад №1 Россия, г. Санкт-Петербург, Невский пр., д. 25 (ст. м. Гостиный двор)
Кофемашина De'Longhi Dedica EC 685 🔥 АКЦИЯ! Компактная рожковая кофемашина. Давление 15 бар, капучинатор. Цвет: черный. Для заказа: @coffeeworld. ООО “КофеМир” 7802123456 https://coffeeworld.ru/coffee-machines/delonghi-ec685 18 990.00 руб. Акция до конца недели! Гарантия 2 года. #подарок Бытовая техника/Кухня/Кофемашины (лучший выбор) DL-EC685-BLK (осталось 3 шт.) Россия, г. Казань, ул. Баумана, д. 40.
Умные часы Samsung Galaxy Watch 4 ⌚️ Смарт-часы с функциями фитнес-трекера. Мониторинг сна, пульсоксиметр. Размер: 44 мм. Все детали здесь! ООО “ГаджетСтиль” (ИНН: 5403234567) https://gadgetstyle.ru/smartwatch/samsung-gw4 15490 руб. Только до 30 сентября скидка 10% по промокоду "SMART10". Электроника/Носимые устройства/Смарт-часы (распродажа) SGW4-44MM-BLK (версия для США) Россия, г. Новосибирск, Красный пр-т, д. 50 (остановка "Красный проспект").
Фитнес-браслет Xiaomi Mi Band 7 — НОВИНКА! 🚀 Яркий AMOLED-дисплей, до 15 дней работы без подзарядки. Водонепроницаемость 5 АТМ. См. отзывы на нашем сайте. ИП Петров А.В. (ОГРН: 310774601234567) https://gadgets.com/xiaomi-mi-band-7 3 490 RUB Возможна доставка СДЭК. #спорт #фитнес #новинка2023 Электроника/Носимые устройства/Фитнес-браслеты///Xiaomi SKU: XB-MB7-BLK (артикул склада 7) Россия, г. Нижний Новгород, ул. Большая Покровская, д. 20 (рядом с площадью Минина).
Беспроводные наушники Sony WH-1000XM5 — ТОП! Наушники с лучшим в мире шумоподавлением. До 30 часов работы. Подробности по тел. 8 (800) 555-35-35 ООО “АудиоТехника” (ИНН 6685456789) https://audiotech.ru/sony-wh-1000xm5 32,990.00 РУБ В комплекте чехол для переноски. По наличию уточняйте. Электроника/Аудио/Наушники SKU: SONY-WH1000XM5 (под заказ) Россия, г. Екатеринбург, ул. Ленина, д. 15 (у магазина "Звук").
Электрический чайник Polaris PWK 1750CA ⚡️ Стеклянный корпус, подсветка, объем 1.7 л. Мощность 2200 Вт. Смотрите видео на youtube.com/pwk1750ca ООО “БытТех” (ОГРН: 1195835012345) https://byt-tech.ru/polaris-pwk1750ca 2190 руб. Самовывоз из магазина. Звоните: +7 (841) 222-33-44. Бытовая техника/Кухня/Чайники (распродажа склада) PWK1750CA-GL / 2022 Россия, г. Пенза, пр-т Строителей, д. 70.
Видеокарта NVIDIA GeForce RTX 4070 Ti — для геймеров! 🎮 Графический ускоритель для геймеров. Память 12 ГБ, GDDR6X. Звоните по номеру: 8(800)555-55-55 ООО “ГигаБайт” ИНН: 7727123456 https://gb-store.ru/gpu/rtx4070ti 85000 RUB Поступление новой партии на следующей неделе. Комплектующие/Видеокарты SKU: GIGABYTE-RTX4070TI, партия №3 Россия, г. Москва, пр-т Вернадского, д. 39, 4 этаж.
Книга “Мастер и Маргарита” М. Булгаков Классическое произведение русской литературы. Твердый переплет, 448 страниц. Купить можно тут. ООО “Книжный мир” (ИНН 7722123456) https://bookshop.com/master-and-margarita 550.00 руб. Бесплатная доставка при заказе от 2000 руб. Книги/Классическая литература ISBN: 978-5-17-087093-6 (официальное издание) Россия, г. Краснодар, ул. Красная, д. 143 (возле парка)
Кроссовки Adidas Superstar — ЛЕГЕНДА! ✨ Классические кожаные кроссовки. Цвет: белый с черными полосками. Размеры: 40-45. ИП Кузнецов П.С. (ОГРН 305780100012345) https://sport-style.ru/adidas-superstar 8 990,00 RUB Скидка 15% для новых клиентов. #спорт #обувь #мода Одежда/Обувь/Кроссовки///Adidas ADI-SS-WHT-BLK (модель 2023 г.) Россия, г. Санкт-Петербург, Лиговский пр-т, д. 30 (м. Площадь Восстания)

На основе этого файла мы и покажем, как по шагам удалять лишний текст, символы, ссылки и прочий мусор, также приводить данные к единому формату. Помните: те же подходы применимы к любым данным — от отзывов до лендов, от карточек товара до вакансий.


Начало работы: контейнер и загрузка для нормализации текста


1) Создаём контейнер

  • Перейдите на платформе CognitiveAI “Работа с файлами Excel, CSV”.
  • Создайте контейнер — это ваше рабочее пространство под конкретный файл.
  • В настройках контейнера выберите нейронную сеть, которая будет обрабатывать данные.
Создаём контейнер Excel

2) Загружаем файл Excel или CSV

  • Важно: CognitiveAI одинаково поддерживает загрузку Excel и CSV. Вам не нужно ничего конвертировать — можно грузить как Excel, так и CSV.
Загружаем файл Excel или CSV

После загрузки файл появится в контейнере. Теперь создаём процессы для удаления лишних слов и символов из текста.


Процессы и чанки. далить текст в скобках и спецсимволы

  • Каждый процесс решает одну задачу: например, удалить ссылки из текста в описании или удалить текст в скобках в названиях.
  • В поле “Описание задачи” вы пишете промпт. Внутри промпта встречаются [A], [B], [C] — это “чанки”, места подстановки данных из столбцов. Например, [A] — это колонка “Название товара”.
  • В поле “Куда сохранить результат” выбираете, куда писать ответ: в этот же столбец (перезаписать) или в новый (рекомендуется для контроля качества и отката).
Процессы и чанки. далить текст в скобках и спецсимволы

Важно: в примерах ниже я буду использовать те же буквенные обозначения столбцов, что и в нашем файле. Вы подставляйте свои для нормализации текста и очистки.


Полная очистка. Процессы для удаления ссылок из текста и лишних слов

Ниже — реальный конвейер “один процесс — одна задача”. Вы можете запускать по очереди, комбинировать, делить на группы, переключать направление сохранения результата.


Процесс 1. Базовая нормализация текста

Задача: привести строки к аккуратному виду: обрезать пробелы по краям, заменить множественные пробелы на один, убрать неразрывные пробелы, табы, лишние переносы, унифицировать кавычки и дефисы.

Описание задачи:

Нормализуй текст из “[A]”: 
- обрежь пробелы по краям; 
- замени последовательности пробелов и табов на один пробел; 
- убери неразрывные пробелы и лишние переносы; 
- унифицируй кавычки к “”; 
- замени длинные/короткие дефисы на стандартный “-”; 
верни только очищенную строку, без комментариев.

Куда сохранить результат: можно перезаписать [A] или сохранить в новый столбец, если он у вас есть.

Аналогично можно запустить для [B] Описание и [F] Примечания, чтобы сразу убрать визуальный мусор.


Процесс 2. Удалить лишние слова из текста в названиях

Задача: убрать промо-эпитеты и эмоциональные вставки, оставить суть.

Описание задачи:

Из текста “[A]” оставь краткое фактическое название товара. Удали любые маркетинговые слова и фразы (например: акция, скидка, супер, топ, хит, распродажа, новинка, лучшая цена), эмодзи, лишние символы и повторяющиеся знаки. Ответ дай одной строкой, без кавычек и без комментариев.

Куда сохранить результат: новый столбец или перезапись [A].


Процесс 3. Удалить лишние символы из текста описания

Задача: убрать эмодзи, повторяющиеся знаки препинания, служебные символы © ® ™ и т. п.

Описание задачи:

Очисти “[B]”: удали эмодзи, служебные символы (©, ®, ™ и прочие), повторяющиеся знаки препинания и любые декоративные символы. Сохрани смысл текста. Верни только очищенное описание.

Куда сохранить результат: новый столбец или перезапись [B].


Процесс 4. Удалить текст в скобках

Задача: убрать комментарии, уточнения, дисклеймеры в скобках любого типа.

Описание задачи:

Из “[B]” удали весь текст в любых скобках, включая вложенные. Оставь остальной текст без лишних пробелов. Ответ — только очищенная строка.

Куда сохранить результат: новый столбец или перезапись [B].


Процесс 5. Удалить ссылки из текста

Задача: очистить текст от URL, UTM, коротких ссылок, соцсетей.

Описание задачи:

Из текста “[B]” удали все ссылки: http/https, www, короткие домены, ссылки на соцсети (включая t.me, vk.com), а также UTM-метки. Сохрани остальное содержание. Верни только чистый текст.

Куда сохранить результат: новый столбец или перезапись [B].

Примечание: Аналогичный процесс можно запустить по [F].


Процесс 6. Как очистить столбец от юридических приписок: только название компании

Задача: оставить фактическое имя компании без ОПФ, ИНН/ОГРН, кавычек.

Описание задачи:

Из строки “[C]” извлеки только фактическое название компании. Удали ОПФ (ИП, ООО, АО, ПАО и т. п.), кавычки, ИНН/ОГРН и другие регистрационные данные, скобки и лишние символы. Ответ — только название компании, без комментариев.

Куда сохранить результат: новый столбец или перезапись [C].


Процесс 7. Цена: оставить только число и нормализовать формат

Задача: убрать валюты и пробелы, привести к числовому формату.

Описание задачи:

Из “[E]” извлеки числовое значение цены. Удали валютные обозначения (руб, ?, RUB и т. п.), пробелы-разделители тысяч. Десятичный разделитель — точка. Ответ — только число, без текста.

Куда сохранить результат: новый столбец или перезапись [E].


Процесс 8. Категории: нормализация текста и разделителей

Задача: привести категории к единому виду.

Описание задачи:

Нормализуй категорию “[G]”: 
- убери лишние слэши и дубликаты разделителей; 
- пропиши каждое слово с заглавной буквы (Title Case); 
- используй разделитель ‘ > ’; 
- обрежь пробелы у границ. 
Ответ — одна строка, только категория.

Куда сохранить результат: новый столбец или перезапись [G].


Процесс 9. Удалить спецсимволы из текста и HTML-теги

Задача: убрать <br>, <div> и любые теги, HTML-сущности.

Описание задачи:

Из “[B]” удали HTML-теги (<...>) и спецсимволы/сущности (&nbsp;, &amp; и т. п.). Сохрани читаемый текст. Верни чистую строку без тегов.

Куда сохранить результат: новый столбец или перезапись [B].


Процесс 10. Удалить дубли слов и лишние пробелы

Задача: часто встречается в названиях и описаниях после импорта.

Описание задачи:

В “[A]” убери подряд идущие одинаковые слова, множественные пробелы, пробелы перед знаками препинания. Смысл не меняй. Ответ — только очищенная строка.

Куда сохранить результат: новый столбец или перезапись [A].


Процесс 11. Как удалить лишний текст в экселе: оставить только SKU

Задача: вытащить артикул из строки с шумом.

Описание задачи:

Из “[H]” извлеки артикул/код товара (например, SKU, модель), убрав любые пояснения, текст в скобках и лишние символы. Если кодов несколько — оставь основной. Ответ — только код.

Куда сохранить результат: новый столбец или перезапись [H].


Процесс 12. Контакты: удалить телефоны и e-mail

Задача: очистить столбец от контактных данных.

Описание задачи:

Из “[F]” удали телефоны любого формата, e-mail-адреса, @-упоминания, хэштеги и ссылки. Сохрани остальной текст. Верни только очищенную строку.

Куда сохранить результат: новый столбец или перезапись [F].


Процесс 13. Удалить текст в скобках в адресах и оставить только город

Задача: для геоаналитики часто нужно выделить город.

Описание задачи:

Из “[I]” извлеки только название города. Удали страну, индекс, названия улиц и станций метро, текст в скобках и лишние символы. Ответ — только город, без комментариев.

Куда сохранить результат: новый столбец или перезапись [I].


Процесс 14. Нормализация текста по регистру

Задача: привести описания к аккуратным предложениям.

Описание задачи:

Отнормируй “[B]”: начни предложения с заглавной буквы, лишние пробелы убери, в середине предложений используй строчные. Прочие символы — по нормам русского языка. Верни только нормализованный текст.

Куда сохранить результат: новый столбец или перезапись [B].


Процесс 15. Удалить ссылки из текста, оставить домен (вариативно)

Задача: иногда нужно не удалить всё, а сократить.

Описание задачи:

Из “[D]”: извлеки основной домен без путей и UTM. Верни только домен. Если ссылки нет — верни пусто.

Куда сохранить результат: новый столбец или перезапись [D].


Запуск процессов

  • Создайте процесс, вставьте промпт в “Описание задачи”.
  • В промпте используйте правильные чанки [A], [B], [C].
  • В “Куда сохранить результат” укажите целевой столбец. Совет: для первых прогонов выбирайте новые столбцы, чтобы видеть разницу.
  • Запустите процесс. Можно закрыть страницу — всё работает автономно.
  • Процесс можно остановить и перезапустить — он продолжит с места остановки.
  • По завершении процесс удаляется автоматически, а результаты останутся в вашем файле.

Параллельные процессы на примере лимиты для нормализации текста

  • Можно запускать сразу несколько процессов для разных задач или разных столбцов.
  • Важно: следите, чтобы два процесса не писали в одну и ту же колонку.
  • Соберите “пайплайн”: сначала нормализация текста, затем удалить ссылки из текста.
  • Учитывайте лимит запросов в минуту на вашем тарифе. Если лимит достигнут, процессы приостановятся и продолжат позже.
  • Большую задачу можно разделить на несколько процессов по диапазонам строк (1–1000, 1001–2000), но это не обязательно — один процесс тоже справится, если укладывается в лимиты.

Проверка и экспорт: после удаления лишних символов из текста

  • Перейдите в “Мои файлы Excel”, откройте документ и убедитесь, что данные очищены.
  • Скачайте готовый файл в Excel и/или CSV — доступно оба формата.

Сценарии: как удалить текст в скобках или ссылки из текста

Ниже — быстрые рецепты промптов под частые запросы.

  • Как yдалить текст в скобках в любом столбце:
    Из “[X]” удали весь текст в скобках и сами скобки. Верни очищенную строку.
  • Как yдалить ссылки из текста:
    Из “[X]” удали все URL (http/https, www), короткие домены и UTM. Верни текст без ссылок.
  • Как yдалить спецсимволы из текста:
    Очисти “[X]” от эмодзи, служебных символов и повторяющихся знаков препинания. Смысл сохрани. Верни чистую строку.
  • Как yдалить лишние слова из текста:
    Из “[X]” оставь только смысловую часть, удалив рекламные эпитеты, маркетинговые приписки, эмоциональные слова и воду. Верни короткую и точную формулировку.
  • Как удалить текст в экселе, оставив только цифры:
    Из “[X]” извлеки только число, убери знаки валют и пробелы-разделители.
  • Как удалить лишний текст в экселе для названий компаний:
    Из “[X]” оставь только название компании, убрав ОПФ, ИНН/ОГРН, кавычки и скобки.

Мини‑чеклист перед запуском ИИ в Excel

  • Контейнер создан, сеть выбрана.
  • При небходимости пустые столбцы для результатов добавлены.
  • Файл загружен как Excel или CSV — оба формата поддерживаются одинаково.
  • Промпты используют правильные чанки [A], [B], [C].
  • Процессы не пишут в один и тот же столбец и не запускают их одновременно.
  • Лимит запросов тарифа учтён.

Нюансы и частые вопросы

  • Нормализация текста и смысл. ИИ не переписывает ваш контент “по настроению” — он следует промпту. Если нужно жёстко удалить только скобки и ничего больше — так и формулируйте.
  • Диапазоны строк. Если файл огромный, делите на части несколькими процессами.
  • Кириллица/латиница, кавычки и дефисы. В Процессе 1 мы сознательно задаём унификацию — это важно для поиска, дедупликации и аналитики.
  • Скобки и вложенность. Попросите явно “удалить вложенные” — и ИИ корректно очистит даже сложные конструкции.
  • Ссылки и UTM. Если не хотите потерять домен, используйте Процесс 15 вместо 5.

Почему это лучше, чем стандартные формулы

  • Гибкость. В одной строке промпта вы совмещаете логику, которую сложно выразить одной формулой Excel (особенно если нужно одновременно удалить лишние символы из текста, убрать скобки и нормализовать пробелы).
  • Скорость. Не сравнить с ручными find/replace и VBA-скриптами, особенно когда в ячейках большие тексты.
  • Масштаб. Параллельные процессы, автономное выполнение, удобный контроль качества.
  • Универсальность. Какая бы цель ни стояла — удалить текст в скобках, удалить спецсимволы из текста, удалить ссылки из текста, как очистить столбец от мусора или как удалить текст в экселе — вы просто формулируете задачу на русском языке, а ИИ делает остальное.

Итоговая пошаговая схема на нашем примере файла

  1. Создайте контейнер и выберите сеть.
  2. Загрузите Excel или CSV. Добавьте пустые столбцы, если это необходимо.
  3. Запустите базовую нормализацию (Процесс 1) для [A], [B], [F].
  4. Удалите лишние слова из текста в [A] (Процесс 2) — получите чистые названия.
  5. Очистите описания: спецсимволы (Процесс 3), ссылки (Процесс 5), текст в скобках (Процесс 4), HTML (Процесс 9), нормализация текста (Процесс 14).
  6. Приведите компании (Процесс 6), цены (Процесс 7), категории (Процесс 8), SKU (Процесс 11), примечания без контактов (Процесс 12), города (Процесс 13).
  7. Проверьте результат в “Мои файлы Excel”, при необходимости запустите дополнительные процессы.
  8. Скачайте итоговый файл в Excel и/или CSV.

Попробуйте собрать свой первый пайплайн на нашем примерном файле. С десятком коротких процессов вы получите идеально чистые данные, готовые к аналитике, импорту на сайт, рекламе — и забудете про ручную чистку навсегда.

Мы используем cookie-файлы Подробнее в Согласии на использование cookie-файлов.
Принять