Автор статьи: Андрей Рогов
Задание номер 27 — одно из самых интересных на ЕГЭ по информатике. Почти всегда оно требует продвинутых навыков программирования, анализа информации и умения искать эффективное решение.
До 2024 года в задании проверялось умение обрабатывать числовые последовательности, но в 2025-м его изменили. Теперь оно связано с анализом данных (прогнозированием, классификацией, кластеризацией, анализом отклонений) и, скорее всего, будет состоять из нескольких этапов:
- сбор первичных данных
- очистка данных и оценка их качества
- выбор и построение модели
- преобразование и визуализация данных
- интерпретация результатов
Проблема в том, что теперь в 27-м задании могут встретиться задачи с разными формулировками, а официальная база включает только одно задание из демоверсии. В этом материале мы собрали всю известную информацию о 27-м задании.
Разбор задания 27 из демоверсии ЕГЭ по информатике — 2025
Сначала разберём задание из демоверсии 2025 года. Видеоверсию можно посмотреть по ссылке. Исходные данные представлены в двух форматах: текст и электронные таблицы. Поэтому задачу можно решить разными средствами.
На первом этапе удобно представить данные графически, построив диаграмму распределения точек. На рисунке — диаграммы для файла А и файла Б, построенные в Microsoft Office Excel и Libre Office Calc.
\
Рисунок 1. Файл А. MS Excel
\
Рисунок 2. Файл Б. Libre Office Calc
Следующий шаг — разбить точки на кластеры и определить центр каждого из них. Важно, что центром кластера является одна из точек. Оба шага можно выполнить с помощью программирования, электронных таблиц или комбинации этих методов.
Решение программированием
Рассмотрим, как сделать задание из демоверсии на языке программирования Python. Ответы для файлов А и Б будут отличаться лишь распределением на кластеры, поэтому приведём решение только для файла А.
# Открытие файла
f = open('demo_2025_27_А.txt')
# Чтение данных точек
# Необходимо заменить запятые точками
dots = f.read().strip().replace(',', '.').split('\n')
for i in range(len(dots)):
dots[i] = [float(s) for s in dots[i].split()]
# Из условия знаем, что в файле два кластера
# Исходя из рисунка, кластеры можно разделить линией y = 3 или x = 1
clusters = [[], []]
for dot in dots:
if dot[1] > 3:
clusters[0].append(dot)
else:
clusters[1].append(dot)
# Для определения центра кластера будем считать сумму расстояний
# каждой точки до всех остальных и искать минимальное
centers = []
for cluster in clusters:
min_s = 10**10
center = []
for dot1 in cluster:
s = 0
for dot2 in cluster:
s += ((dot1[0] − dot2[0]) ** 2 + (dot1[1] − dot2[1]) ** 2) ** 0.5
if s < min_s:
min_s = s
center = dot1
centers.append(center)
# Среднее арифметическое координат, умноженное на 10 000
print((centers[0][0] + centers[1][0]) / 2 * 10 000)
print((centers[0][1] + centers[1][1]) / 2 * 10 000)
Решение с помощью электронных таблиц
Чтобы сделать задание с помощью электронных таблиц, нужно выполнить те же самые действия. Идея принадлежит PRO100ЕГЭ. Покажем решение на примере файла Б.
На первом этапе мы уже построили диаграмму и можем визуально определить границы кластера. Для этого достаточно выделить две линии на графике: y = 4 и x = 5.

Добавим в файле дополнительный столбец, чтобы определить, какому кластеру принадлежит точка. Содержимое ячейки — формула с условной функцией.

Чтобы разделить точки на кластеры с помощью фильтра, оставим на листе данные каждого кластера по очереди и скопируем точки на отдельные листы.
Теперь нужно работать с каждым кластером по отдельности. Чтобы определить центр, необходимо вычислить сумму расстояний до всех остальных точек кластера. В этом нам помогут формулы массивов, которые позволяют использовать в вычислениях диапазоны.
Задать формулу для вычисления суммы расстояний до всех точек кластера можно так:

Знак \$ используют для фиксирования диапазона, поскольку формулу необходимо скопировать на все точки. Важный момент: завершать ввод формулы следует нажатием клавиш Ctrl + Shift + Enter, так как это сочетание преобразует формулу в формулу массивов.
Чтобы понять, сработало или нет, нужно заглянуть в строку формул. Если формула разместится между фигурными скобками, всё в порядке.

Чтобы найти центр кластера, нужно отсортировать точки по возрастанию суммы расстояний.

Аналогичные действия проделаем с двумя оставшимися кластерами и скопируем координаты центров на отдельный лист. Далее определим среднее арифметическое каждой из координат. Так, мы нашли ответ на вопрос для файла Б.

Что говорят о 27-м задании разработчики ЕГЭ
Как видно из нашего разбора, задание 27 можно легко сделать, если знать конкретную формулировку задачи и способ её решения. Но мы не знаем точно, каким будет это задание на экзамене.
В августе проходил Всероссийский съезд учителей информатики. На нём выступил Сергей Крылов, руководитель комиссии по разработке КИМ ЕГЭ. Отвечая на вопросы, он призвал пользоваться всеми источниками информации, в том числе информацией от блогеров и репетиторов.
На онлайн-консультации Рособрнадзора «ЕГЭ на все 100» в октябре 2024 года Сергей Крылов тоже говорил о 27-м задании. Вот что он отметил:
- задание будет на кластеризацию данных
- в решении нужно построить график точек в электронных таблицах, наглядно оценить кластеры
- для файла Б, возможно, потребуется написать программу, поскольку файлы будут отличаться количеством точек и в файле Б их будет больше
- для решения не понадобится писать оптимальный алгоритм
- возможно, будут дополнительные элементы анализа данных, например искажения в данных и аномалии, которые можно определить по графику
- погрешность вещественной арифметики не будет влиять на ответ
- кластеров будет немного
Из ещё одного вебинара мы знаем, что в условии может измениться:
- количество и размер кластеров
- аномалии — больше двух точек соответствуют аномальным наблюдениям, их нужно отбросить
- способ разделения на кластеры — может быть задан центр пересечения прямых, разделяющих кластеры. В таком случае понадобится определить углы наклона и количество прямых
Как подготовиться к заданию 27
Задание 27 — высокого уровня сложности и традиционно считается одним из самых трудных на экзамене. Оно меняется каждый год, и ни разу демоверсия не совпадала с реальным заданием. Поэтому нельзя сказать, будет ли задание 27 в 2025 году таким же, как в демоверсии.
Мы считаем, что оптимально решать разные вариации задания, которые появляются в сети. Предлагаем решить подборку задач, чтобы закрепить навыки.