Если вы ищете способ удалить лишние слова из текста в Excel, удалить лишние символы из текста, выполнить нормализацию текста, удалить текст в скобках, удалить спецсимволы из текста или удалить ссылки из текста — эта статья для вас. Мы покажем, как за минуты очистить данные с помощью ИИ на нашей платформе CognitiveAI. Один процесс — одна задача, и вы избавитесь от рутины навсегда.
Кому полезно удалить лишние слова из текста и символы в повседневных задачах
- Интернет-магазины: чистка названий товаров и описаний, удаление промо-слов “акция”, “скидка”, эмодзи.
- Аналитики и маркетологи: убрать UTM, ссылки, хэштеги, нормализация текста перед сегментацией.
- HR и продажи: очистить контакты, оставить только имена, должности, компании.
- Любые команды, которые устали искать, как удалить лишний текст в экселе, и хотят перестать чистить данные вручную.
Что чистим удалить лишние символы из текста, текст в скобках и ссылки
- Удалить лишние слова из текста: рекламные эпитеты, длинные приписки “скидка, акция”, дубли, вводные фразы.
- Удалить лишние символы из текста: эмодзи, повторяющиеся знаки препинания, спецсимволы, лишние пробелы и переносы.
- Нормализация текста: приводим к единому регистру, заменяем кавычки и дефисы на корректные, чистим неразрывные пробелы.
- Удалить спецсимволы из текста: © ® ™, служебные символы, HTML-сущности.
- Удалить ссылки из текста: http/https, www, короткие ссылки, телеграм-handles, социальные сети.
- Извлечь или удалить телефоны, e-mail, ИНН/ОГРН, артикулы, SKU, коды.
- Оставить только цифры или только буквы, убрать валюты и единицы измерений.
- Очистить столбец от лишних тегов, хэштегов, обращений @, ID.
Как работает нормализация текста и очистка на CognitiveAI
- Вы создаёте контейнер — рабочее пространство под конкретный файл.
- Загружаете Excel или CSV (важно: платформа одинаково работает и с Excel, и с CSV; это ключевое преимущество — не нужно конвертировать).
- Создаёте процессы. В процессе вы пишете промпт (описание задачи), а в текст подставляются “чанки” — данные из выбранных столбцов, которые у вас обозначаются как
[A],[B],[C]и т. п. Один процесс — одна конкретная задача. - Запускаете и ждёте. Можно закрыть страницу — процесс завершится автономно. По готовности результат сохраняется в выбранный столбец (перезапись или новый столбец).
- Скачиваете готовый Excel и/или CSV.
Подробнее про работу с Excel-таблицами с помощью ИИ
Пример файла для очистки данных из Excel
Представим реальный набор, который часто встречается в интернет-торговле и каталогах:
Столбцы:
[A]Название товара — “iPhone 13 Pro Max — ХИТ! ?? Супер цена (новинка 2022)”[B]Описание — “Смартфон Apple. Память 256 ГБ. Цвет: графит. Подробнее: https://site.ru/p/123 (действует акция)”[C]Компания — “ООО “ТехМаркет” (ИНН 7701234567, ОГРН 1207700123456)”[D]Ссылка — “https://site.ru/product?id=123&utm_source=google&utm_medium=cpc”[E]Цена — “89 990 руб.” или “89,990 RUB”[F]Примечания — “Подробности в Telegram: t.me/techshop, звоните +7 (999) 123-45-67, #новинка”[G]Категория — “Электроника/Смартфоны///Apple”[H]Артикул — “SKU: IP13PM-256-GR (временно недоступно)”[I]Адрес/Город — “Россия, г. Москва, ул. Тверская, д. 1 (м. Тверская)”
| Название товара | Описание | Компания | Ссылка | Цена | Примечания | Категория | Артикул | Адрес/Город |
|---|---|---|---|---|---|---|---|---|
| iPhone 13 Pro Max — ХИТ! 💥 Супер цена (новинка 2022) | Смартфон Apple. Память 256 ГБ. Цвет: графит. Подробнее: https://site.ru/p/123 (действует акция). | ООО “ТехМаркет” (ИНН 7701234567, ОГРН 1207700123456) | https://site.ru/product?id=123&utm_source=google&utm_medium=cpc | 89 990 руб. | Подробности в Telegram: t.me/techshop, звоните +7 (999) 123-45-67, #новинка. | Электроника/Смартфоны///Apple | SKU: IP13PM-256-GR (временно недоступно) | Россия, г. Москва, ул. Тверская, д. 1 (м. Тверская) |
| Ноутбук Lenovo IdeaPad 5 — ТОП ПРОДАЖ! 💻 | Мощный ноутбук для работы и учебы. Процессор Intel Core i5, 16 ГБ ОЗУ, SSD 512 ГБ. Спецпредложение тут: https://bestshop.com/lenovo_sale | ИП Иванов И.И. ИНН 500123456789 ОГРН 315500100012345 | https://bestshop.com/laptops/lenovo-ideapad | 55,500 RUB | Бесплатная доставка по городу. Звоните по номеру +7 (495) 111-22-33. | Электроника/Компьютеры/Ноутбуки///Lenovo | LN-IP5-i5-16G-512S; Склад №1 | Россия, г. Санкт-Петербург, Невский пр., д. 25 (ст. м. Гостиный двор) |
| Кофемашина De'Longhi Dedica EC 685 🔥 АКЦИЯ! | Компактная рожковая кофемашина. Давление 15 бар, капучинатор. Цвет: черный. Для заказа: @coffeeworld. | ООО “КофеМир” 7802123456 | https://coffeeworld.ru/coffee-machines/delonghi-ec685 | 18 990.00 руб. | Акция до конца недели! Гарантия 2 года. #подарок | Бытовая техника/Кухня/Кофемашины (лучший выбор) | DL-EC685-BLK (осталось 3 шт.) | Россия, г. Казань, ул. Баумана, д. 40. |
| Умные часы Samsung Galaxy Watch 4 ⌚️ | Смарт-часы с функциями фитнес-трекера. Мониторинг сна, пульсоксиметр. Размер: 44 мм. Все детали здесь! | ООО “ГаджетСтиль” (ИНН: 5403234567) | https://gadgetstyle.ru/smartwatch/samsung-gw4 | 15490 руб. | Только до 30 сентября скидка 10% по промокоду "SMART10". | Электроника/Носимые устройства/Смарт-часы (распродажа) | SGW4-44MM-BLK (версия для США) | Россия, г. Новосибирск, Красный пр-т, д. 50 (остановка "Красный проспект"). |
| Фитнес-браслет Xiaomi Mi Band 7 — НОВИНКА! 🚀 | Яркий AMOLED-дисплей, до 15 дней работы без подзарядки. Водонепроницаемость 5 АТМ. См. отзывы на нашем сайте. | ИП Петров А.В. (ОГРН: 310774601234567) | https://gadgets.com/xiaomi-mi-band-7 | 3 490 RUB | Возможна доставка СДЭК. #спорт #фитнес #новинка2023 | Электроника/Носимые устройства/Фитнес-браслеты///Xiaomi | SKU: XB-MB7-BLK (артикул склада 7) | Россия, г. Нижний Новгород, ул. Большая Покровская, д. 20 (рядом с площадью Минина). |
| Беспроводные наушники Sony WH-1000XM5 — ТОП! | Наушники с лучшим в мире шумоподавлением. До 30 часов работы. Подробности по тел. 8 (800) 555-35-35 | ООО “АудиоТехника” (ИНН 6685456789) | https://audiotech.ru/sony-wh-1000xm5 | 32,990.00 РУБ | В комплекте чехол для переноски. По наличию уточняйте. | Электроника/Аудио/Наушники | SKU: SONY-WH1000XM5 (под заказ) | Россия, г. Екатеринбург, ул. Ленина, д. 15 (у магазина "Звук"). |
| Электрический чайник Polaris PWK 1750CA ⚡️ | Стеклянный корпус, подсветка, объем 1.7 л. Мощность 2200 Вт. Смотрите видео на youtube.com/pwk1750ca | ООО “БытТех” (ОГРН: 1195835012345) | https://byt-tech.ru/polaris-pwk1750ca | 2190 руб. | Самовывоз из магазина. Звоните: +7 (841) 222-33-44. | Бытовая техника/Кухня/Чайники (распродажа склада) | PWK1750CA-GL / 2022 | Россия, г. Пенза, пр-т Строителей, д. 70. |
| Видеокарта NVIDIA GeForce RTX 4070 Ti — для геймеров! 🎮 | Графический ускоритель для геймеров. Память 12 ГБ, GDDR6X. Звоните по номеру: 8(800)555-55-55 | ООО “ГигаБайт” ИНН: 7727123456 | https://gb-store.ru/gpu/rtx4070ti | 85000 RUB | Поступление новой партии на следующей неделе. | Комплектующие/Видеокарты | SKU: GIGABYTE-RTX4070TI, партия №3 | Россия, г. Москва, пр-т Вернадского, д. 39, 4 этаж. |
| Книга “Мастер и Маргарита” М. Булгаков | Классическое произведение русской литературы. Твердый переплет, 448 страниц. Купить можно тут. | ООО “Книжный мир” (ИНН 7722123456) | https://bookshop.com/master-and-margarita | 550.00 руб. | Бесплатная доставка при заказе от 2000 руб. | Книги/Классическая литература | ISBN: 978-5-17-087093-6 (официальное издание) | Россия, г. Краснодар, ул. Красная, д. 143 (возле парка) |
| Кроссовки Adidas Superstar — ЛЕГЕНДА! ✨ | Классические кожаные кроссовки. Цвет: белый с черными полосками. Размеры: 40-45. | ИП Кузнецов П.С. (ОГРН 305780100012345) | https://sport-style.ru/adidas-superstar | 8 990,00 RUB | Скидка 15% для новых клиентов. #спорт #обувь #мода | Одежда/Обувь/Кроссовки///Adidas | ADI-SS-WHT-BLK (модель 2023 г.) | Россия, г. Санкт-Петербург, Лиговский пр-т, д. 30 (м. Площадь Восстания) |
На основе этого файла мы и покажем, как по шагам удалять лишний текст, символы, ссылки и прочий мусор, также приводить данные к единому формату. Помните: те же подходы применимы к любым данным — от отзывов до лендов, от карточек товара до вакансий.
Начало работы: контейнер и загрузка для нормализации текста
1) Создаём контейнер
- Перейдите на платформе CognitiveAI “Работа с файлами Excel, CSV”.
- Создайте контейнер — это ваше рабочее пространство под конкретный файл.
- В настройках контейнера выберите нейронную сеть, которая будет обрабатывать данные.

2) Загружаем файл Excel или CSV
- Важно: CognitiveAI одинаково поддерживает загрузку Excel и CSV. Вам не нужно ничего конвертировать — можно грузить как Excel, так и CSV.
После загрузки файл появится в контейнере. Теперь создаём процессы для удаления лишних слов и символов из текста.
Процессы и чанки. далить текст в скобках и спецсимволы
- Каждый процесс решает одну задачу: например, удалить ссылки из текста в описании или удалить текст в скобках в названиях.
- В поле “Описание задачи” вы пишете промпт. Внутри промпта встречаются
[A],[B],[C]— это “чанки”, места подстановки данных из столбцов. Например,[A]— это колонка “Название товара”. - В поле “Куда сохранить результат” выбираете, куда писать ответ: в этот же столбец (перезаписать) или в новый (рекомендуется для контроля качества и отката).
Важно: в примерах ниже я буду использовать те же буквенные обозначения столбцов, что и в нашем файле. Вы подставляйте свои для нормализации текста и очистки.
Полная очистка. Процессы для удаления ссылок из текста и лишних слов
Ниже — реальный конвейер “один процесс — одна задача”. Вы можете запускать по очереди, комбинировать, делить на группы, переключать направление сохранения результата.
Процесс 1. Базовая нормализация текста
Задача: привести строки к аккуратному виду: обрезать пробелы по краям, заменить множественные пробелы на один, убрать неразрывные пробелы, табы, лишние переносы, унифицировать кавычки и дефисы.
Описание задачи:
Нормализуй текст из “[A]”:
- обрежь пробелы по краям;
- замени последовательности пробелов и табов на один пробел;
- убери неразрывные пробелы и лишние переносы;
- унифицируй кавычки к “”;
- замени длинные/короткие дефисы на стандартный “-”;
верни только очищенную строку, без комментариев.
Куда сохранить результат: можно перезаписать [A] или сохранить в новый столбец, если он у вас есть.
Аналогично можно запустить для [B] Описание и [F] Примечания, чтобы сразу убрать визуальный мусор.
Процесс 2. Удалить лишние слова из текста в названиях
Задача: убрать промо-эпитеты и эмоциональные вставки, оставить суть.
Описание задачи:
Из текста “[A]” оставь краткое фактическое название товара. Удали любые маркетинговые слова и фразы (например: акция, скидка, супер, топ, хит, распродажа, новинка, лучшая цена), эмодзи, лишние символы и повторяющиеся знаки. Ответ дай одной строкой, без кавычек и без комментариев.
Куда сохранить результат: новый столбец или перезапись [A].
Процесс 3. Удалить лишние символы из текста описания
Задача: убрать эмодзи, повторяющиеся знаки препинания, служебные символы © ® ™ и т. п.
Описание задачи:
Очисти “[B]”: удали эмодзи, служебные символы (©, ®, ™ и прочие), повторяющиеся знаки препинания и любые декоративные символы. Сохрани смысл текста. Верни только очищенное описание.
Куда сохранить результат: новый столбец или перезапись [B].
Процесс 4. Удалить текст в скобках
Задача: убрать комментарии, уточнения, дисклеймеры в скобках любого типа.
Описание задачи:
Из “[B]” удали весь текст в любых скобках, включая вложенные. Оставь остальной текст без лишних пробелов. Ответ — только очищенная строка.
Куда сохранить результат: новый столбец или перезапись [B].
Процесс 5. Удалить ссылки из текста
Задача: очистить текст от URL, UTM, коротких ссылок, соцсетей.
Описание задачи:
Из текста “[B]” удали все ссылки: http/https, www, короткие домены, ссылки на соцсети (включая t.me, vk.com), а также UTM-метки. Сохрани остальное содержание. Верни только чистый текст.
Куда сохранить результат: новый столбец или перезапись [B].
Примечание: Аналогичный процесс можно запустить по [F].
Процесс 6. Как очистить столбец от юридических приписок: только название компании
Задача: оставить фактическое имя компании без ОПФ, ИНН/ОГРН, кавычек.
Описание задачи:
Из строки “[C]” извлеки только фактическое название компании. Удали ОПФ (ИП, ООО, АО, ПАО и т. п.), кавычки, ИНН/ОГРН и другие регистрационные данные, скобки и лишние символы. Ответ — только название компании, без комментариев.
Куда сохранить результат: новый столбец или перезапись [C].
Процесс 7. Цена: оставить только число и нормализовать формат
Задача: убрать валюты и пробелы, привести к числовому формату.
Описание задачи:
Из “[E]” извлеки числовое значение цены. Удали валютные обозначения (руб, ?, RUB и т. п.), пробелы-разделители тысяч. Десятичный разделитель — точка. Ответ — только число, без текста.
Куда сохранить результат: новый столбец или перезапись [E].
Процесс 8. Категории: нормализация текста и разделителей
Задача: привести категории к единому виду.
Описание задачи:
Нормализуй категорию “[G]”:
- убери лишние слэши и дубликаты разделителей;
- пропиши каждое слово с заглавной буквы (Title Case);
- используй разделитель ‘ > ’;
- обрежь пробелы у границ.
Ответ — одна строка, только категория.
Куда сохранить результат: новый столбец или перезапись [G].
Процесс 9. Удалить спецсимволы из текста и HTML-теги
Задача: убрать <br>, <div> и любые теги, HTML-сущности.
Описание задачи:
Из “[B]” удали HTML-теги (<...>) и спецсимволы/сущности ( , & и т. п.). Сохрани читаемый текст. Верни чистую строку без тегов.
Куда сохранить результат: новый столбец или перезапись [B].
Процесс 10. Удалить дубли слов и лишние пробелы
Задача: часто встречается в названиях и описаниях после импорта.
Описание задачи:
В “[A]” убери подряд идущие одинаковые слова, множественные пробелы, пробелы перед знаками препинания. Смысл не меняй. Ответ — только очищенная строка.
Куда сохранить результат: новый столбец или перезапись [A].
Процесс 11. Как удалить лишний текст в экселе: оставить только SKU
Задача: вытащить артикул из строки с шумом.
Описание задачи:
Из “[H]” извлеки артикул/код товара (например, SKU, модель), убрав любые пояснения, текст в скобках и лишние символы. Если кодов несколько — оставь основной. Ответ — только код.
Куда сохранить результат: новый столбец или перезапись [H].
Процесс 12. Контакты: удалить телефоны и e-mail
Задача: очистить столбец от контактных данных.
Описание задачи:
Из “[F]” удали телефоны любого формата, e-mail-адреса, @-упоминания, хэштеги и ссылки. Сохрани остальной текст. Верни только очищенную строку.
Куда сохранить результат: новый столбец или перезапись [F].
Процесс 13. Удалить текст в скобках в адресах и оставить только город
Задача: для геоаналитики часто нужно выделить город.
Описание задачи:
Из “[I]” извлеки только название города. Удали страну, индекс, названия улиц и станций метро, текст в скобках и лишние символы. Ответ — только город, без комментариев.
Куда сохранить результат: новый столбец или перезапись [I].
Процесс 14. Нормализация текста по регистру
Задача: привести описания к аккуратным предложениям.
Описание задачи:
Отнормируй “[B]”: начни предложения с заглавной буквы, лишние пробелы убери, в середине предложений используй строчные. Прочие символы — по нормам русского языка. Верни только нормализованный текст.
Куда сохранить результат: новый столбец или перезапись [B].
Процесс 15. Удалить ссылки из текста, оставить домен (вариативно)
Задача: иногда нужно не удалить всё, а сократить.
Описание задачи:
Из “[D]”: извлеки основной домен без путей и UTM. Верни только домен. Если ссылки нет — верни пусто.
Куда сохранить результат: новый столбец или перезапись [D].
Запуск процессов
- Создайте процесс, вставьте промпт в “Описание задачи”.
- В промпте используйте правильные чанки
[A],[B],[C]. - В “Куда сохранить результат” укажите целевой столбец. Совет: для первых прогонов выбирайте новые столбцы, чтобы видеть разницу.
- Запустите процесс. Можно закрыть страницу — всё работает автономно.
- Процесс можно остановить и перезапустить — он продолжит с места остановки.
- По завершении процесс удаляется автоматически, а результаты останутся в вашем файле.
Параллельные процессы на примере лимиты для нормализации текста
- Можно запускать сразу несколько процессов для разных задач или разных столбцов.
- Важно: следите, чтобы два процесса не писали в одну и ту же колонку.
- Соберите “пайплайн”: сначала нормализация текста, затем удалить ссылки из текста.
- Учитывайте лимит запросов в минуту на вашем тарифе. Если лимит достигнут, процессы приостановятся и продолжат позже.
- Большую задачу можно разделить на несколько процессов по диапазонам строк (1–1000, 1001–2000), но это не обязательно — один процесс тоже справится, если укладывается в лимиты.
Проверка и экспорт: после удаления лишних символов из текста
- Перейдите в “Мои файлы Excel”, откройте документ и убедитесь, что данные очищены.
- Скачайте готовый файл в Excel и/или CSV — доступно оба формата.
Сценарии: как удалить текст в скобках или ссылки из текста
Ниже — быстрые рецепты промптов под частые запросы.
- Как yдалить текст в скобках в любом столбце:
Из “[X]” удали весь текст в скобках и сами скобки. Верни очищенную строку. - Как yдалить ссылки из текста:
Из “[X]” удали все URL (http/https, www), короткие домены и UTM. Верни текст без ссылок. - Как yдалить спецсимволы из текста:
Очисти “[X]” от эмодзи, служебных символов и повторяющихся знаков препинания. Смысл сохрани. Верни чистую строку. - Как yдалить лишние слова из текста:
Из “[X]” оставь только смысловую часть, удалив рекламные эпитеты, маркетинговые приписки, эмоциональные слова и воду. Верни короткую и точную формулировку. - Как удалить текст в экселе, оставив только цифры:
Из “[X]” извлеки только число, убери знаки валют и пробелы-разделители. - Как удалить лишний текст в экселе для названий компаний:
Из “[X]” оставь только название компании, убрав ОПФ, ИНН/ОГРН, кавычки и скобки.
Мини‑чеклист перед запуском ИИ в Excel
- Контейнер создан, сеть выбрана.
- При небходимости пустые столбцы для результатов добавлены.
- Файл загружен как Excel или CSV — оба формата поддерживаются одинаково.
- Промпты используют правильные чанки
[A],[B],[C]. - Процессы не пишут в один и тот же столбец и не запускают их одновременно.
- Лимит запросов тарифа учтён.
Нюансы и частые вопросы
- Нормализация текста и смысл. ИИ не переписывает ваш контент “по настроению” — он следует промпту. Если нужно жёстко удалить только скобки и ничего больше — так и формулируйте.
- Диапазоны строк. Если файл огромный, делите на части несколькими процессами.
- Кириллица/латиница, кавычки и дефисы. В Процессе 1 мы сознательно задаём унификацию — это важно для поиска, дедупликации и аналитики.
- Скобки и вложенность. Попросите явно “удалить вложенные” — и ИИ корректно очистит даже сложные конструкции.
- Ссылки и UTM. Если не хотите потерять домен, используйте Процесс 15 вместо 5.
Почему это лучше, чем стандартные формулы
- Гибкость. В одной строке промпта вы совмещаете логику, которую сложно выразить одной формулой Excel (особенно если нужно одновременно удалить лишние символы из текста, убрать скобки и нормализовать пробелы).
- Скорость. Не сравнить с ручными find/replace и VBA-скриптами, особенно когда в ячейках большие тексты.
- Масштаб. Параллельные процессы, автономное выполнение, удобный контроль качества.
- Универсальность. Какая бы цель ни стояла — удалить текст в скобках, удалить спецсимволы из текста, удалить ссылки из текста, как очистить столбец от мусора или как удалить текст в экселе — вы просто формулируете задачу на русском языке, а ИИ делает остальное.
Итоговая пошаговая схема на нашем примере файла
- Создайте контейнер и выберите сеть.
- Загрузите Excel или CSV. Добавьте пустые столбцы, если это необходимо.
- Запустите базовую нормализацию (Процесс 1) для
[A],[B],[F]. - Удалите лишние слова из текста в
[A](Процесс 2) — получите чистые названия. - Очистите описания: спецсимволы (Процесс 3), ссылки (Процесс 5), текст в скобках (Процесс 4), HTML (Процесс 9), нормализация текста (Процесс 14).
- Приведите компании (Процесс 6), цены (Процесс 7), категории (Процесс 8), SKU (Процесс 11), примечания без контактов (Процесс 12), города (Процесс 13).
- Проверьте результат в “Мои файлы Excel”, при необходимости запустите дополнительные процессы.
- Скачайте итоговый файл в Excel и/или CSV.
Попробуйте собрать свой первый пайплайн на нашем примерном файле. С десятком коротких процессов вы получите идеально чистые данные, готовые к аналитике, импорту на сайт, рекламе — и забудете про ручную чистку навсегда.
Похожие публикации:
ИИ в Эксель Как нейросети меняет правила игры с таблицами и автоматизирует 90% вашей рутины
SEO описание товаров с помощью ИИ и Excel/CSV
Нейросети для генерации текста, от болтливых алгоритмов до литературных гениев
Что такое промпты для нейронной сети
ИИ Агенты понятно о сложном. Где встретить технологии будущего сегодня
Основы искусственного интеллекта. Понимание AI для новичков
RAG: В мире ИИ-агентов – как получить точные и актуальные ответы
Как начать карьеру в области искусственного интеллекта