Повторяющиеся значения в Excel — найти, выделить или удалить дубликаты в Excel
В сегодняшних Excel файлах дубликаты встречаются повсеместно. К примеру, когда вы создаете составную таблицу из других таблиц, вы можете обнаружить в ней повторяющиеся значения, или в файле с общим доступом внесли одинаковые данные два разных пользователя, что привело к задвоению и т.д. Дубликаты могут возникнуть в одном столбце, в нескольких столбцах или даже во всем листе. В Microsoft Excel реализовано несколько инструментов поиска, выделения и, при необходимости, удаления повторяющихся значений. Ниже описаны основные методики определения дубликатов в Excel.
1. Удаление повторяющихся значений в Excel (2007+)
Предположим, у вас имеется таблица, состоящая из трех столбцов, в которой присутствуют одинаковые записи и вам необходимо избавится от них. Выделяем область таблицы, в которой хотите удалить повторяющиеся значения. Вы можете выделить один или несколько столбцов, или всю таблицу целиком. Переходим по вкладке Данные в группу Работа с данными, щелкаем по кнопке Удалить дубликаты.
Если в каждом столбце таблицы имеется заголовок, установить маркер Мои данные содержат заголовки. Также проставляем маркеры напротив тех столбцов, в которых требуется произвести поиск дубликатов.
Щелкаем ОК, диалоговое окно будет закрыто и строки, содержащие дубликаты будут удалены.
Данная функция предназначена для удаления записей, которые полностью дублируют строки в таблице. Если вы выделили не все столбцы для определения дубликатов, строки с повторяющимися значениями также будут удалены.
2. Использование расширенного фильтра для удаления дубликатов
Выберите любую ячейку в таблице, перейдите по вкладке Данные в группу Сортировка и фильтр, щелкните по кнопке Дополнительно.
В появившемся диалоговом окне Расширенный фильтр, необходимо установить переключатель в положение скопировать результат в другое место, в поле Исходный диапазон указать диапазон, в котором находится таблица, в поле Поместить результат в диапазон указать верхнюю левую ячейку будущей отфильтрованной таблицы и установить маркер Только уникальные значения. Щелкаем ОК.
На месте, указанном для размещения результатов работы расширенного фильтра, будет создана еще одна таблица, но уже с отфильтрованными, по уникальным значениям, данными.
3. Выделение повторяющихся значений с помощью условного форматирования в Excel (2007+)
Выделяем таблицу, в которой необходимо обнаружить повторяющиеся значения. Переходим по вкладке Главная в группу Стили, выбираем Условное форматирование -> Правила выделения ячеек -> Повторяющиеся значения.
В появившемся диалоговом окне Повторяющиеся значения, необходимо выбрать формат выделения дубликатов. У меня по умолчанию установлено светло-красная заливка и темно-красный цвет текста
Обратите внимание, в данном случае Excel будет сравнивать на уникальность не всю строку таблицы, а лишь ячейку столбца, поэтому если у вас имеются повторяющиеся значения только в одном столбце, Excel отформатирует их тоже. На примере вы можете увидеть, как Excel залил некоторые ячейки третьего столбца с именами, хотя вся строка данной ячейки таблицы уникальна
4. Использование сводных таблиц для определения повторяющихся значений
Воспользуемся уже знакомой нам таблицей с тремя столбцами и добавим четвертый, под названием Счетчик, и заполним его единицами (1). Выделяем всю таблицу и переходим по вкладке Вставка в группу Таблицы, щелкаем по кнопке Сводная таблица.
Создаем сводную таблицу. В поле Название строк помещаем три первых столбца, в поле Значения помещаем столбец со счетчиком. В созданной сводной таблице, записи со значением больше единицы будут дубликатами, само значение будет означать количество повторяющихся значений. Для большей наглядности, можно отсортировать таблицу по столбцу Счетчик, чтобы сгруппировать дубликаты.
2. Как НЕ нужно сортировать данные в Excel
Не менее важно узнать, о самом опасном способе сортировки данных в Excel, такой метод может испортить ваши исходные данные. Проблема возникает если в таблице много данных, а вы случайно отсортировали только один столбец данных
Каждая строка с данными в Microsoft Excel действительно похоже на запись, которая должна быть такой же по всей строке
Проблема возникает если в таблице много данных, а вы случайно отсортировали только один столбец данных. Каждая строка с данными в Microsoft Excel действительно похоже на запись, которая должна быть такой же по всей строке.
На изображении ниже, Я раскрасил строки, таким образом опасное место с сортировкой только одного столбца данных, будет выделено.
Я задал цвета строкам в этом примере, чтобы мы могли убедиться, что наши данные отсортированы правильно. Цвета должны проходить полностью через каждую строку без перерывов, если данные сортируются правильно.
Большая ошибка пользователей Excel заключается в выборе только одного столбца при сортировке и выборе неправильного параметра в следующем окне.
Excel даже пытается предупредить нас, показывая окно Обнаруженны данные вне указанного диапазона. Во всплывающем окне можно выбрать автоматически расширить выделенный диапазон (выберите это!) и сортировать в пределах указанного выделения.
Я всегда думал, что варианты, которые дает вам это окно, не совсем ясны. Просто знайте, что вы захотите использовать автоматически расширить выделенный диапазон, чтобы убедиться, что Excel затронет все столбцы при сортировке данных.
Для тестирования давайте посмотрим, что произойдет, если мы выберем один столбец и выберем тип сортировки сортировать в пределах указанного выделения.
Использование вариант сортировать в приделах указанного диапазона сортирует только один столбец данных, который обязательно разрушит вашу исходную электронную таблицу.
На скриншоте ниже вы можете видеть, насколько проблематичен этот тип сортировки. Так как столбец Amount Billed был отсортирован от наименьшего до наибольшего, все остальные столбцы остались на месте. Это означает, что наши данные больше не верны.
Как вы видите из несоответствия цветов, были отсортированы только данные в столбце Amount Billed, поэтому теперь таблица некорректна.
Таким образом, при сортировке данных есть два ключевых «НЕ»:
- Не начинайте, выделив один столбец в своей электронной таблице.
- Не используйте вариант сортировать в приделах указанного диапазона, если вы работаете не с одним столбцом, убедитесь, что вы расширили выделенный диапазон.
В зависимости от возрастания и убывания
Данный метод сортировки осуществляется так же, как по алфавиту. Различие будет лишь в наименовании функций: «По возрастанию», а также, «По убыванию».
По нескольким полям файла
Если сортировка необходима одновременно в нескольких столбиках и по нескольким параметрам, пригодится опция под названием «Настраиваемая сортировка». Рассмотрим ее.
Говоря о том, каким именно образом будет осуществлена подобная сортировка, стоит заметить, что Эксель пойдет по списку сверху. Первый уровень является наиболее приоритетным. Например, нами выбрано «сортировать людей в зависимости от имени от А до Я – выполнено.
Затем, следующее условие состоит в сортировке списка в зависимости от возраста (по увеличению). Что же получается? Имена так и останутся рассортированные по алфавиту, однако люди-тёзки будут располагаться в определенном порядке – от самых младших к самым старшим.
Итак, прежде всего, были отсортированы строчки в зависимости от имен
После этого, следует обратить внимание на имя Дарья. Их 4, однако располагаются они в той последовательности, как и были в таблице изначально
Тогда было добавлено дополнительное условие – расположить людей в от самого младшего к наиболее старшему. В итоге, наша таблица отсортирована не только в зависимости от имен, но также, по возрастам и теперь вы знаете как сортировать по алфавиту в excel.
При работе с данными в Excel очень часто возникает необходимость сортировать список каких-то элементов по алфавиту или от меньшего значения к большему. Естественно, нет никакой необходимости делать эту рутинную работу вручную, ведь в Excel есть инструменты для решения таких распространенных задач.
В данном материале мы расскажем о том, как сделать список по алфавиту в табличном процессоре Excel. Материал будет полезен для пользователей всех современных версий этой программы, среди которых Excel 2007, 2010, 2013 и 2016.
Также с помощью той же кнопки можно включить функцию под названием «Фильтр». В этом случае рядом с верхней ячейкой появится стрелка вниз, с помощью которой можно добавить фильтр и скрыть ненужные данные. Такая фильтрация значительно упрощает работу с разнообразными списками.
Например, если у вас есть список фамилий, то вы можете отфильтровать его таким образом, чтобы скрыть те фамилии, для которых не указаны инициалы. Для этого сначала нужно нажать на стрелку вниз, которая находится рядом с первой ячейкой.
В открывшемся окне вводим точку и нажимаем на кнопку «ОК».
В результате фамилии без инициалов (а точнее ячейки, которые не содержат символ точки) будут отфильтрованы и скрыты из списка.
Для того чтобы снова отобразить все элементы списка нужно снова нажать на стрелку рядом с верхней ячейкой и выбрать пункт «Удалить фильтр».
Аналогичные кнопки есть также и на вкладке «Данные». Здесь есть кнопки, отвечающие за сортировку списков «от А до Я», «от Я до А», а также кнопка для настройки «Фильтров».
Работают эти кнопки точно также как те, которые находятся на вкладке «Данные». Выделяете список и нажимаете на кнопку.
Сортировка данных по дням недели или месяцам в Excel
Вы также можете сортировать данные по дням недели или месяцам года, используя тот же встроенный пользовательский список, который Excel использует для добавления дней или месяцев на рабочий лист, используя дескриптор заполнения. Этот список позволяет сортировать по месяцам или месяцам в хронологическом порядке, а не в алфавитном порядке.
Как и в случае с другими параметрами сортировки, сортировка значений по пользовательскому списку может отображаться по возрастанию (с воскресенья по субботу / январь по декабрь) или по убыванию (с субботы по воскресенье / декабрь по январь).
На изображении выше были выполнены следующие шаги для сортировки образца данных в диапазоне H2 в L12 по месяцам года:
- Выделите диапазон сортируемых ячеек.
- Нажми на Главная вкладку ленты.
- Нажми на Сортировка и фильтр на ленте, чтобы открыть раскрывающийся список.
- Нажмите на Пользовательская сортировка в раскрывающемся списке, чтобы Сортировать диалоговое окно.
- Под колонка заголовок в диалоговом окне, выберите Месяц начался из раскрывающегося списка для сортировки данных по месяцам года.
- Сортировать по параметр остается установленным для Ценности — поскольку сортировка основана на фактических данных в таблице.
- Под Порядок сортировки заголовок, нажмите стрелку вниз рядом со значением по умолчанию От А до Я возможность открыть раскрывающееся меню.
- В меню выберите Пользовательский список для открытия Пользовательские списки диалоговое окно.
- В левом окне диалогового окна щелкните один раз в списке: Январь февраль март апрель… для его выбора.
- Нажмите Хорошо для подтверждения выбора и возврата к Сортировать в диалоговом окне.
- Выбранный список -Январь февраль март апрель — будет отображаться под порядок заголовок.
- Нажмите Хорошо закрыть диалоговое окно и отсортировать данные по месяцам года.
По умолчанию пользовательские списки отображаются только по возрастанию порядок в Пользовательские списки диалоговое окно. Для сортировки данных в порядке убывания с использованием пользовательского списка после выбора нужного списка, чтобы он отображался под порядок заголовок в диалоговом окне «Сортировка»:
- Нажмите стрелку вниз рядом с отображаемым списком, например Январь февраль март апрель…, чтобы открыть раскрывающееся меню.
- В меню выберите параметр настраиваемого списка, который отображается в порядке убывания, например Декабрь, Ноябрь, Октябрь, Сентябрь …
- Нажмите Хорошо для закрытия диалогового окна и сортировки данных в порядке убывания с использованием настраиваемого списка.
Динамическая сортировка таблицы в MS Excel
Если применить к таблице стандартную сортировку, то при изменении данных она не будет актуальной. Нужно сделать так, чтобы значения сортировались автоматически. Используем формулы.
- Есть набор простых чисел, которые нужно отсортировать по возрастанию.
- Ставим курсор в соседнюю ячейку и вводим формулу: =НАИМЕНЬШИЙ(A:A;СТРОКА(A1)). Именно так. В качестве диапазона указываем весь столбец. А в качестве коэффициента – функцию СТРОКА со ссылкой на первую ячейку.
- Изменим в исходном диапазоне цифру 7 на 25 – «сортировка» по возрастанию тоже изменится.
Если необходимо сделать динамическую сортировку по убыванию, используем функцию НАИБОЛЬШИЙ.
Для динамической сортировки текстовых значений понадобятся формулы массива.
- Исходные данные – перечень неких названий в произвольном порядке. В нашем примере – список фруктов.
- Выделяем столбец и даем ему имя «Фрукты». Для этого в поле имен, что находится возле строки формул вводим нужное нам имя для присвоения его к выделенному диапазону ячеек.
- В соседней ячейке (в примере – в В5) пишем формулу: Так как перед нами формула массива, нажимаем сочетание Ctrl + Shift + Enter. Размножаем формулу на весь столбец.
- Если в исходный столбец будут добавляться строки, то вводим чуть модифицированную формулу: Добавим в диапазон «фрукты» еще одно значение «помело» и проверим:
Впоследствии при добавлении данных в таблицу процесс сортирования будет выполняться автоматически.
Как сортировать данные в Excel?
Выделение данных для сортировки
Выделите диапазон табличных данных, например A1:L5 (несколько строк и столбцов) или C1:C80 (один столбец). Этот диапазон может включать и заголовки столбцов.
Выделите одну ячейку в столбце, в котором требуется выполнить сортировку.
Чтобы выполнить сортировку по возрастанию (от А до Я или от наименьшего числа к наибольшему), на вкладке Данные в группе Сортировка и фильтрация нажмите кнопку
Чтобы выполнить сортировку по убыванию (от Я до А или от наибольшего числа к наименьшему), нажмите кнопку
Сортировка по указанным условиям
Эта возможность позволяет выбрать столбец для сортировки, а также другие критерии, например цвет шрифта или ячейки.
Выделите одну любую ячейку в диапазоне, для которого требуется выполнить сортировку.
Нажмите на вкладке Данные в группе Сортировка и фильтрация кнопку Сортировка. Откроется диалоговое окно «Сортировка».
Выберите в раскрывающемся списке Сортировать по первый столбец, для которого вы хотите выполнить сортировку.
Выберите в списке Сортировка пункт Значения, Цвет ячейки, Цвет шрифта или Значок ячейки.
В списке Порядок выберите порядок сортировки, который вы хотите применить. Можно сортировать текст и числа по возрастанию и по убыванию: от А до Я или от Я до А для текста и от наименьшего к наибольшему или от наибольшего к наименьшему для чисел.
Порядок сортировки в Excel
Существует два способа открыть меню сортировки:
- Щелкнуть правой кнопкой мыши по таблице. Выбрать «Сортировку» и способ.
- Открыть вкладку «Данные» — диалоговое окно «Сортировка».
Часто используемые методы сортировки представлены одной кнопкой на панели задач:
Сортировка таблицы по отдельному столбцу:
- Чтобы программа правильно выполнила задачу, выделяем нужный столбец в диапазоне данных.
- Далее действуем в зависимости от поставленной задачи. Если нужно выполнить простую сортировку по возрастанию/убыванию (алфавиту или обратно), то достаточно нажать соответствующую кнопку на панели задач. Когда диапазон содержит более одного столбца, то Excel открывает диалоговое окно вида: Чтобы сохранилось соответствие значений в строках, выбираем действие «автоматически расширить выделенный диапазон». В противном случае отсортируется только выделенный столбец – структура таблицы нарушится.
Если выделить всю таблицу и выполнить сортировку, то отсортируется первый столбец. Данные в строках станут в соответствии с положением значений в первом столбце.
Настраиваемая сортировка
Но, как видим, при указанных видах сортировки по одному значению, данные, содержащие имена одного и того же человека, выстраиваются внутри диапазона в произвольном порядке.
А, что делать, если мы хотим отсортировать имена по алфавиту, но например, при совпадении имени сделать так, чтобы данные располагались по дате? Для этого, а также для использования некоторых других возможностей, все в том же меню «Сортировка и фильтр», нам нужно перейти в пункт «Настраиваемая сортировка…».
После этого, открывается окно настроек сортировки
Если в вашей таблице есть заголовки, то обратите внимание, чтобы в данном окне обязательно стояла галочка около параметра «Мои данные содержат заголовки»
В поле «Столбец» указываем наименование столбца, по которому будет выполняться сортировка. В нашем случае, это столбец «Имя». В поле «Сортировка» указывается, по какому именно типу контента будет производиться сортировка. Существует четыре варианта:
- Значения;
- Цвет ячейки;
- Цвет шрифта;
- Значок ячейки.
Но, в подавляющем большинстве случаев, используется пункт «Значения». Он и выставлен по умолчанию. В нашем случае, мы тоже будем использовать именно этот пункт.
В графе «Порядок» нам нужно указать, в каком порядке будут располагаться данные: «От А до Я» или наоборот. Выбираем значение «От А до Я».
Итак, мы настроили сортировку по одному из столбцов. Для того, чтобы настроить сортировку по другому столбцу, жмем на кнопку «Добавить уровень».
Появляется ещё один набор полей, который следует заполнить уже для сортировки по другому столбцу. В нашем случае, по столбцу «Дата». Так как в данных ячеек установлен формат даты, то в поле «Порядок» мы устанавливаем значения не «От А до Я», а «От старых к новым», или «От новых к старым».
Таким же образом, в этом окне можно настроить, при необходимости, и сортировку по другим столбцам в порядке приоритета. Когда все настройки выполнены, жмем на кнопку «OK».
Как видим, теперь в нашей таблице все данные отсортированы, в первую очередь, по именам сотрудника, а затем, по датам выплат.
Но, это ещё не все возможности настраиваемой сортировки. При желании, в этом окне можно настроить сортировку не по столбцам, а по строкам. Для этого, кликаем по кнопке «Параметры».
В открывшемся окне параметров сортировки, переводим переключатель из позиции «Строки диапазона» в позицию «Столбцы диапазона». Жмем на кнопку «OK».
Теперь, по аналогии с предыдущим примером, можно вписывать данные для сортировки. Вводим данные, и жмем на кнопку «OK».
Как видим, после этого, столбцы поменялись местами, согласно введенным параметрам.
Конечно, для нашей таблицы, взятой для примера, применение сортировки с изменением места расположения столбцов не несет особенной пользы, но для некоторых других таблиц подобный вид сортировки может быть очень уместным.