Дальше начинается практика: как выгрузить данные без потерь, как превратить CSV в понятный отчёт, как быстро проверить качество доноров и как поставить процесс на регулярные рельсы — от таблиц до полуавтоматизации.
Категория: Основы и ограничения GSC
Подкатегория: Что показывает отчёт Links
В GSC отчёт “Links” (Ссылки) даёт обзор внешних ссылок, внутренних ссылок и анкорного текста, а также показывает, какие страницы получают больше всего ссылок и какие сайты чаще всего ссылаются на ваш ресурс. Эти данные полезны для диагностики и общей картины, но не стоит воспринимать их как «полный список всех существующих ссылок в интернете».
Отчёт агрегирует информацию: например, домены в разделе “Top linking sites” отображаются как корневые (root domain), а данные по URL учитывают каноникализацию (canonical). На практике это значит, что при анализе нужно отдельно следить за тем, на какие канонические страницы фактически «собираются» ссылки, и не путать это с реальными URL, которые ставили вебмастера.
Подкатегория: Лимиты выгрузки и почему «всё не влезает»
Классический экспорт таблиц внутри отчёта часто ограничивается 1 000 строками, поэтому на средних и больших проектах данные могут усекаться. Для внешних ссылок в отчёте предусмотрены варианты выгрузки больших списков (до 100 000 строк) — например “Latest links” и “More sample links”, но это всё равно выборки, а не гарантия «абсолютно всех ссылок».
Правильная тактика: воспринимать выгрузку как “репрезентативный набор”, который отлично подходит для мониторинга трендов, поиска проблемных посадочных страниц и быстрого аудита доноров. Для полноты картины обычно добавляют внешние базы ссылок и/или техническую проверку страниц-доноров краулером.
Категория: Способы экспорта (от простого к продвинутому)
Подкатегория: Встроенный экспорт в GSC (лучший старт)
Встроенный экспорт — идеален, если нужно быстро:
- посмотреть «кто ссылается»;
- проверить анкоры;
- собрать список доноров для ручного аудита;
- подготовить ежемесячный мини-отчёт клиенту.
Что важно сделать сразу после выгрузки: сохранить исходник как “RAW” (без правок) и работать только с копией. Это дисциплина, которая экономит часы, когда через неделю понадобится перепроверить расчёты или восстановить «первичку».
Подкатегория: Сторонние SEO-платформы и расширения (ускорение рутины)
Если нужно больше данных, чем отдаёт GSC, или требуется анализ конкурентов, обычно используют сторонние индексы ссылок (Ahrefs/Serpstat и аналоги). У Ahrefs, например, предусмотрен экспорт отчётов — это удобно для передачи данных в таблицы и дальнейшей обработки в своём шаблоне отчётности.
Практический подход для SEO:
- GSC — источник «что Google видит и связывает с сайтом» (сигнал от поисковика).
- Внешний индекс — источник «максимального покрытия» и метрик (сила домена/страницы, типы ссылок, история и т. д.).
- Итоговый вывод — только после технической проверки «вживую» (см. аудит доноров ниже).
Подкатегория: Screaming Frog и техническая проверка доноров
Когда список доноров уже есть, ключевая задача — проверить, что ссылка действительно существует, доступна, не спрятана и ведёт туда, куда нужно. Подход “audit backlinks” в Screaming Frog как раз про это: сбор данных по URL, извлечение ссылок/атрибутов и проверка факторов, которые могут обесценивать ссылку (например, директивы и атрибуты).
Сильная сторона метода: вы не «верите списку», а подтверждаете реальность ссылок на текущий момент. Это особенно важно для старых проектов, где часть доноров может быть уже удалена, переведена на редиректы или закрыта.
Подкатегория: Автоматизация и BigQuery (не путать типы данных)
Google развивает Bulk Data Export в BigQuery как способ регулярного экспорта данных Search Console для масштабной аналитики, но важно понимать: этот экспорт относится к performance-данным (клики/показы/запросы/страницы), а не напрямую к отчёту внешних ссылок. Поэтому «автоматизация ссылок» чаще строится не через bulk export, а через регулярные выгрузки + собственный склад данных (Sheets/SQL) + краулер/обогащение внешними сервисами.
Категория: Рабочий процесс SEO-специалиста (практика)
Подкатегория: Цели — прежде чем выгружать
Перед экспортом ответьте на 3 вопроса (это влияет на формат таблиц и глубину):
- Зачем нужен список ссылок: восстановление потерянных, чистка токсичных, рост категорий, отчёт клиенту, план линкбилдинга?
- Какой период интересует: «свежие ссылки» или «максимум разнообразия доноров»?
- Что будет результатом: список задач (ToDo), дашборд, KPI, план контент-работ?
Подкатегория: Схема папок и именование файлов (чтобы не утонуть)
Рекомендуемая структура (под любой проект/клиента):
- /seo/backlinks/PROJECT_NAME/
- /seo/backlinks/PROJECT_NAME/01_raw_gsc/
- /seo/backlinks/PROJECT_NAME/02_processed/
- /seo/backlinks/PROJECT_NAME/03_audit/
- /seo/backlinks/PROJECT_NAME/04_reports/
Схема именования файлов (понятно человеку и удобно сортируется):
- PROJECT_gsc_links_latest_YYYY-MM-DD.csv
- PROJECT_gsc_links_sample_YYYY-MM-DD.csv
- PROJECT_backlinks_master_YYYY-MM-DD.xlsx
- PROJECT_donor_audit_YYYY-MM-DD.xlsx
- PROJECT_tasks_backlinks_YYYY-MM-DD.xlsx
Правило: дата всегда в формате YYYY-MM-DD — так файлы сортируются правильно в любой ОС, и проще вести историю выгрузок.
Подкатегория: Логика объединения источников
Оптимальный «скелет» процесса:
- Выгрузить ссылки из GSC (Latest + Sample) и сохранить RAW.
- Нормализовать URL (привести к единому виду) и убрать дубликаты.
- Обогатить данные: добавить столбцы “тип страницы”, “приоритет”, “коммерческая/инфо”, “кластер”.
- Прогнать доноров краулером/валидатором и проставить статусы (есть ссылка/нет, 200/301/404, индексируется/нет).
- Сформировать список задач: восстановить, заменить, усилить, отклонить, запросить обновление у донора.
Категория: Готовые шаблоны таблиц (структура колонок)
Подкатегория: Таблица 1 — Backlinks Master (единый реестр)
Используйте эту таблицу как «единый источник правды», куда подтягиваются данные из всех выгрузок/проверок.
| Колонка | Тип | Пример | Зачем нужна |
|---|---|---|---|
| source | text | GSC_latest / GSC_sample / Ahrefs | Понимать происхождение строки. |
| export_date | date | 2025-12-12 | История изменений и сравнение дельт. |
| donor_url | url | https://site.com/page | Страница, где стоит ссылка. |
| donor_domain | text | site.com | Группировка доноров по доменам. |
| target_url | url | https://your.com/category/ | Куда ведёт ссылка. |
| target_type | text | category / product / blog | Приоритизация: что усиливаем ссылками. |
| anchor | text | купить … | Анализ анкоров и рисков переспама. |
| link_type | text | follow / nofollow / ugc / sponsored / unknown | Для GSC часто будет unknown, уточняется аудитом. |
| http_status_donor | number | 200 / 301 / 404 | Быстро увидеть «мёртвые» доноры. |
| found_link | boolean | TRUE/FALSE | Факт наличия ссылки по результатам проверки. |
| rel_attr | text | nofollow | Что реально стоит в rel (если извлекали). |
| first_seen | date | 2025-10-01 | Когда впервые появилась в вашей базе. |
| last_seen | date | 2025-12-12 | Когда последний раз подтверждали. |
| priority | text | high/med/low | План работ и фокус команды. |
| notes | text | Контакт найден, запросили правку | Контекст и история коммуникаций. |
Подкатегория: Таблица 2 — Donor Audit (качество и риски)
Эта таблица — для оценки качества доноров и принятия решений (оставить/восстановить/попросить правку/отклонить).
| Колонка | Тип | Пример | Комментарий |
|---|---|---|---|
| donor_domain | text | site.com | Один домен — одна строка (агрегация). |
| domain_theme | text | news / forum / blog | Релевантность тематике. |
| language | text | ru / en | Риски нерелевантности. |
| traffic_signals | text | есть/нет | По косвенным признакам: активность, обновления. |
| outbound_links_level | text | low/med/high | «Линкопомойки» видно сразу. |
| indexation_check | text | indexed/not | Быстрая проверка индексации (ручная/скрипт). |
| spam_signals | text | none/suspected/high | Триггеры: дорвейность, агрессивная реклама. |
| contact | text | email/формы | Для восстановления/правок. |
| decision | text | keep / recover / disavow_candidate | Решение по домену. |
| reason | text | 404 donor / nofollow / adult | Почему принято решение. |
| next_step | text | письмо / замена URL | Конкретный шаг, не «потом». |
Подкатегория: Таблица 3 — Tasks (ссылка → действие → результат)
Таблица задач — то, что реально приносит деньги/рост, потому что превращает аудит в план работ.
| Колонка | Пример |
|---|---|
| task_id | BL-2025-1212-001 |
| task_type | recover_link / change_target / remove_toxic |
| donor_url | https://site.com/page |
| target_url_old | https://your.com/old |
| target_url_new | https://your.com/new |
| owner | seo / outreach / dev |
| status | new/in_progress/done/on_hold |
| due_date | 2025-12-20 |
| result | ссылка восстановлена |
| proof | скрин/URL/дата |
Категория: Чек-лист аудита доноров (быстро и по делу)
Подкатегория: Проверка существования и доступности
- Страница донора открывается без капчи и отдаёт 200 (или понятный 301 на актуальную страницу).
- Ссылка реально присутствует в HTML (не только через скрипты, которые могут не рендериться).
- Ссылка ведёт на правильный целевой URL (без лишних редиректов).
- Анкор выглядит естественно и соответствует контексту.
Подкатегория: Проверка «ценности» ссылки
- Страница донора индексируется и не выглядит заброшенной.
- Ссылка не спрятана в футере «на 200 сайтов», не окружена спамом и не выглядит покупной.
- На странице нет явных сигналов дорвея/переспама (тонны ключей, авто-тексты).
- Исходящая ссылочность разумная (не «каталог всего»).
Подкатегория: Технические факторы (минимум, который стоит фиксировать)
- Атрибуты rel: follow/nofollow/ugc/sponsored (фиксировать фактическое значение).
- Наличие промежуточных редиректов/трекеров.
- Блокировки: robots/noindex для страницы (если применимо по вашей методике).
- Каноникал: совпадает ли целевая каноническая страница с тем, что вы продвигаете.
Подкатегория: Риски и действия
- Если донор «сомнительный», но ссылка полезная: попытаться заменить анкор на брендовый/нейтральный, перенести ссылку в релевантный текст, изменить целевой URL на более логичный.
- Если донор токсичный и явно спамный: отметить как disavow_candidate, но решение принимать после оценки доли таких доменов и возможных причин появления.
FAQ
Вопрос: Можно ли выгрузить из Google Search Console все внешние ссылки без ограничений?
Ответ: GSC показывает данные в отчёте Links, но выгрузка имеет лимиты и часто представляет собой выборку; для максимального покрытия используют сочетание GSC, внешних индексов и технической проверки доноров.
Вопрос: Что лучше выгружать — Latest links или More sample links?
Ответ: “Latest links” удобнее для мониторинга свежих изменений, а “More sample links” — для периодического обзора разнообразия ссылочного профиля, но оба варианта остаются ограниченной выборкой.
Вопрос: Можно ли автоматизировать выгрузку ссылок через BigQuery?
Ответ: Bulk Data Export в BigQuery относится к performance-данным Search Console (клики/показы/запросы/страницы), поэтому для внешних ссылок чаще автоматизируют процесс через регулярные выгрузки и собственную базу, а не через bulk export.
Вопрос: Зачем проверять доноров, если ссылка уже есть в отчёте GSC?
Ответ: Наличие в отчёте означает, что Google связывал ссылку с сайтом, но на практике ссылка могла исчезнуть или измениться, поэтому аудит доноров через краулер помогает подтвердить актуальность и качество.