Чего ожидать от задания 27 на ЕГЭ по информатике в 2025 году

Автор статьи: Андрей Рогов

Задание номер 27 — одно из самых интересных на ЕГЭ по информатике. Почти всегда оно требует продвинутых навыков программирования, анализа информации и умения искать эффективное решение.

До 2024 года в задании проверялось умение обрабатывать числовые последовательности, но в 2025-м его изменили. Теперь оно связано с анализом данных (прогнозированием, классификацией, кластеризацией, анализом отклонений) и, скорее всего, будет состоять из нескольких этапов:

  • сбор первичных данных
  • очистка данных и оценка их качества
  • выбор и построение модели
  • преобразование и визуализация данных
  • интерпретация результатов

Проблема в том, что теперь в 27-м задании могут встретиться задачи с разными формулировками, а официальная база включает только одно задание из демоверсии. В этом материале мы собрали всю известную информацию о 27⁠-⁠м задании.

Разбор задания 27 из демоверсии ЕГЭ по информатике — 2025

Сначала разберём задание из демоверсии 2025 года. Видеоверсию можно посмотреть по ссылке. Исходные данные представлены в двух форматах: текст и электронные таблицы. Поэтому задачу можно решить разными средствами.

На первом этапе удобно представить данные графически, построив диаграмму распределения точек. На рисунке — диаграммы для файла А и файла Б, построенные в Microsoft Office Excel и Libre Office Calc.

Рисунок 1. Файл А. MS Excel.webp\
Рисунок 1. Файл А. MS Excel

Рисунок 2. Файл Б. Libre Office Calc.webp\
Рисунок 2. Файл Б. Libre Office Calc

Следующий шаг — разбить точки на кластеры и определить центр каждого из них. Важно, что центром кластера является одна из точек. Оба шага можно выполнить с помощью программирования, электронных таблиц или комбинации этих методов.

Решение программированием

Рассмотрим, как сделать задание из демоверсии на языке программирования Python. Ответы для файлов А и Б будут отличаться лишь распределением на кластеры, поэтому приведём решение только для файла А.

# Открытие файла
f = open('demo_2025_27_А.txt')
# Чтение данных точек
# Необходимо заменить запятые точками
dots = f.read().strip().replace(',', '.').split('\n')
for i in range(len(dots)):
    dots[i] = [float(s) for s in dots[i].split()]
# Из условия знаем, что в файле два кластера
# Исходя из рисунка, кластеры можно разделить линией y = 3 или x = 1
clusters = [[], []]
for dot in dots:
    if dot[1] > 3:
        clusters[0].append(dot)
    else:
        clusters[1].append(dot)
# Для определения центра кластера будем считать сумму расстояний
# каждой точки до всех остальных и искать минимальное
centers = []
for cluster in clusters:
    min_s = 10**10
    center = []
    for dot1 in cluster:
        s = 0
        for dot2 in cluster:
            s += ((dot1[0] − dot2[0]) ** 2 + (dot1[1] − dot2[1]) ** 2) ** 0.5
        if s < min_s:
            min_s = s
            center = dot1
    centers.append(center)
# Среднее арифметическое координат, умноженное на 10 000
print((centers[0][0] + centers[1][0]) / 2 * 10 000)
print((centers[0][1] + centers[1][1]) / 2 * 10 000)

Решение с помощью электронных таблиц

Чтобы сделать задание с помощью электронных таблиц, нужно выполнить те же самые действия. Идея принадлежит PRO100ЕГЭ. Покажем решение на примере файла Б.

На первом этапе мы уже построили диаграмму и можем визуально определить границы кластера. Для этого достаточно выделить две линии на графике: y = 4 и x = 5.

Рисунок 2. Файл Б. Libre Office Calc. Решение.webp

Добавим в файле дополнительный столбец, чтобы определить, какому кластеру принадлежит точка. Содержимое ячейки — формула с условной функцией.

Таблица 1.webp

Чтобы разделить точки на кластеры с помощью фильтра, оставим на листе данные каждого кластера по очереди и скопируем точки на отдельные листы.

Теперь нужно работать с каждым кластером по отдельности. Чтобы определить центр, необходимо вычислить сумму расстояний до всех остальных точек кластера. В этом нам помогут формулы массивов, которые позволяют использовать в вычислениях диапазоны.

Задать формулу для вычисления суммы расстояний до всех точек кластера можно так:

Таблица 2.webp

Знак \$ используют для фиксирования диапазона, поскольку формулу необходимо скопировать на все точки. Важный момент: завершать ввод формулы следует нажатием клавиш Ctrl + Shift + Enter, так как это сочетание преобразует формулу в формулу массивов.

Чтобы понять, сработало или нет, нужно заглянуть в строку формул. Если формула разместится между фигурными скобками, всё в порядке.

Таблица 3.webp

Чтобы найти центр кластера, нужно отсортировать точки по возрастанию суммы расстояний.

Таблица 4.webp

Аналогичные действия проделаем с двумя оставшимися кластерами и скопируем координаты центров на отдельный лист. Далее определим среднее арифметическое каждой из координат. Так, мы нашли ответ на вопрос для файла Б.

Таблица 5.webp

Что говорят о 27-м задании разработчики ЕГЭ

Как видно из нашего разбора, задание 27 можно легко сделать, если знать конкретную формулировку задачи и способ её решения. Но мы не знаем точно, каким будет это задание на экзамене.

В августе проходил Всероссийский съезд учителей информатики. На нём выступил Сергей Крылов, руководитель комиссии по разработке КИМ ЕГЭ. Отвечая на вопросы, он призвал пользоваться всеми источниками информации, в том числе информацией от блогеров и репетиторов.

На онлайн-консультации Рособрнадзора «ЕГЭ на все 100» в октябре 2024 года Сергей Крылов тоже говорил о 27-м задании. Вот что он отметил:

  • задание будет на кластеризацию данных
  • в решении нужно построить график точек в электронных таблицах, наглядно оценить кластеры
  • для файла Б, возможно, потребуется написать программу, поскольку файлы будут отличаться количеством точек и в файле Б их будет больше
  • для решения не понадобится писать оптимальный алгоритм
  • возможно, будут дополнительные элементы анализа данных, например искажения в данных и аномалии, которые можно определить по графику
  • погрешность вещественной арифметики не будет влиять на ответ
  • кластеров будет немного

Из ещё одного вебинара мы знаем, что в условии может измениться:

  • количество и размер кластеров
  • аномалии — больше двух точек соответствуют аномальным наблюдениям, их нужно отбросить
  • способ разделения на кластеры — может быть задан центр пересечения прямых, разделяющих кластеры. В таком случае понадобится определить углы наклона и количество прямых

Как подготовиться к заданию 27

Задание 27 — высокого уровня сложности и традиционно считается одним из самых трудных на экзамене. Оно меняется каждый год, и ни разу демоверсия не совпадала с реальным заданием. Поэтому нельзя сказать, будет ли задание 27 в 2025 году таким же, как в демоверсии.

Мы считаем, что оптимально решать разные вариации задания, которые появляются в сети. Предлагаем решить подборку задач, чтобы закрепить навыки.

Источник: Яндекс Учебник — Чего ожидать от задания 27 на ЕГЭ по информатике в 2025 году. Каталог разборов: education.yandex.ru.

Назад к статьям Поделиться