Csv файл excel 2007

Файл формата csv: чем открыть, описание, особенности

Данные как ваша отправная точка

Когда вы начинаете проект по data science, вам придется работать с данными, которые вы собрали по всему интернету, и с наборами данных, которые вы загрузили из других мест — Kaggle, Quandl и тд

Но чаще всего вы также найдете данные в Google или в репозиториях, которые используются другими пользователями. Эти данные могут быть в файле Excel или сохранены в файл с расширением .csv … Возможности могут иногда казаться бесконечными, но когда у вас есть данные, в первую очередь вы должны убедиться, что они качественные.

В случае с электронной таблицей вы можете не только проверить, могут ли эти данные ответить на вопрос исследования, который вы имеете в виду, но также и можете ли вы доверять данным, которые хранятся в электронной таблице.

Проверяем качество таблицы

  • Представляет ли электронная таблица статические данные?
  • Смешивает ли она данные, расчеты и отчетность?
  • Являются ли данные в вашей электронной таблице полными и последовательными?
  • Имеет ли ваша таблица систематизированную структуру рабочего листа?
  • Проверяли ли вы действительные формулы в электронной таблице?

Этот список вопросов поможет убедиться, что ваша таблица не грешит против лучших практик, принятых в отрасли. Конечно, этот список не исчерпывающий, но позволит провести базовую проверку таблицы.

Лучшие практики для данных электронных таблиц

Прежде чем приступить к чтению вашей электронной таблицы на Python, вы также должны подумать о том, чтобы настроить свой файл в соответствии с некоторыми основными принципами, такими как:

  • Первая строка таблицы обычно зарезервирована для заголовка, а первый столбец используется для идентификации единицы выборки;
  • Избегайте имен, значений или полей с пробелами. В противном случае каждое слово будет интерпретироваться как отдельная переменная, что приведет к ошибкам, связанным с количеством элементов на строку в вашем наборе данных. По возможности, используйте:
  • подчеркивания,
  • тире,
  • горбатый регистр, где первая буква каждого слова пишется с большой буквы
  • объединяющие слова
  • Короткие имена предпочтительнее длинных имен;
  • старайтесь не использовать имена, которые содержат символы ?, $,%, ^, &, *, (,), -, #,? ,,, <,>, /, |, \, , {, и };
  • Удалите все комментарии, которые вы сделали в вашем файле, чтобы избежать добавления в ваш файл лишних столбцов или NA;
  • Убедитесь, что все пропущенные значения в вашем наборе данных обозначены как NA.

Затем, после того, как вы внесли необходимые изменения или тщательно изучили свои данные, убедитесь, что вы сохранили внесенные изменения. Сделав это, вы можете вернуться к данным позже, чтобы отредактировать их, добавить дополнительные данные или изменить их, сохранив формулы, которые вы, возможно, использовали для расчета данных и т.д.

Если вы работаете с Microsoft Excel, вы можете сохранить файл в разных форматах: помимо расширения по умолчанию .xls или .xlsx, вы можете перейти на вкладку «Файл», нажать «Сохранить как» и выбрать одно из расширений, которые указаны в качестве параметров «Сохранить как тип». Наиболее часто используемые расширения для сохранения наборов данных в data science — это .csv и .txt (в виде текстового файла с разделителями табуляции). В зависимости от выбранного варианта сохранения поля вашего набора данных разделяются вкладками или запятыми, которые образуют символы-разделители полей вашего набора данных.

Теперь, когда вы проверили и сохранили ваши данные, вы можете начать с подготовки вашего рабочего окружения.

Конвертировать CSV в Excel

Копирование вставки CSV (Comma Separated Values) довольно просто в Microsoft Excel!

Что такое CSV-файл (Comma Separated Values) в Википедии

Короче: используйте параметр «Данные»> «Текст в столбцы».

Как открыть файл csv в excel с помощью столбцов

Начиная с CSV-файла, как и следующий, откройте его в Excel, используя стандартное открытие файла Excel, используя сочетание клавиш CTRL + O или открыв его в проводнике Windows с помощью правого клика и выбора. Открыть с помощью Excel 2010 / Excel 2013 / Excel 2016, в зависимости от установленной версии.

Каждая строка помещается в одну ячейку, в то время как вы можете захотеть, чтобы они были разделены столбцами, поэтому предстоящие шаги.

Как импортировать в Excel несколько файлов CSV

Думаю, Вы знаете, что Microsoft Excel позволяет открывать несколько файлов CSV при помощи команды Open (Открыть).

  1. На вкладке File (Файл) нажмите Open (Открыть) и в выпадающем списке в нижней правой части диалогового окна выберите Text Files (Текстовые файлы).
  2. Чтобы выделить несколько файлов подряд, кликните по первому файлу, затем нажав и удерживая клавишу Shift, кликните по крайнему файл. Оба эти файла, а также все, что находятся между ними, будут выделены.Чтобы выделить файлы, расположенные не подряд, удерживайте клавишу Ctrl и щелкайте по каждому файлу .csv, который хотите открыть.
  3. Когда выделены все нужные файлы CSV, нажмите кнопку Open (Открыть).

Этот способ простой и быстрый, и мы могли бы назвать его отличным, если бы не одно обстоятельство – каждый файл CSV открывается таким образом как отдельная книга Excel. На практике переключение туда-сюда между несколькими открытыми файлами Excel может быть крайне неудобным и обременительным.

Исходные данные и требования

В качестве примера давайте представим, что нам нужно обратиться к файлу «TestExcel.xls», который расположен на диске D. Сами данные расположены на листе со стандартным названием «Лист1», они имеют следующую структуру.

ProductId CategoryId ProductName Price
1 1 Клавиатура 100
2 1 Мышь 50
3 2 Телефон 300

Все примеры будут выполнены в Microsoft SQL Server 2016 Express.

Для того чтобы начать пользоваться распределенными запросами, нам сначала нужно включить данную возможность на SQL сервере, так как по умолчанию она выключена.

Включается возможность использования распределённых запросов с помощью системной хранимой процедуры sp_configure, которая отвечает за системные параметры сервера. Нам необходимо параметру Ad Hoc Distributed Queries присвоить значение 1, для этого выполните следующую SQL инструкцию.

   
   sp_configure 'show advanced options', 1;
   RECONFIGURE;
   GO
   sp_configure 'Ad Hoc Distributed Queries', 1;
   RECONFIGURE;
   GO

Параметром show advanced options мы отображаем дополнительные параметры системной хранимой процедуры sp_configure, а командой RECONFIGURE мы применяем новые параметры.

Преобразование CSV в Excel: проблемы и решения

Формат CSV используется уже более 30 лет, но несмотря на его длительную историю, он никогда не был официально задокументирован. Название CSV (Comma-Separated Values) возникло из-за использования запятых для разделения полей данных. Но это в теории. На самом деле, множество так называемых CSV-файлов используют другие символы для разделения данных, например:

  • Табуляция – TSV-файлы (tab-separated values)
  • Точка с запятой – SCSV-файлы (semicolon separated values)

Некоторые вариации файлов CSV разделяют поля данных одинарными или двойными кавычками, другие требуют маркер последовательности байтов из Юникода (BOM), например, UTF-8, для корректной интерпретации Юникода.

Это отсутствие стандартов порождает разнообразные проблемы, с которыми Вы можете столкнуться, пытаясь преобразовать файл Excel в CSV , и особенно, когда импортируете файл CSV в Excel. Давайте разберёмся с известными проблемами, начиная с самой распространённой.

Файл CSV отображается в Excel неправильно

Признаки: Вы пытаетесь открыть файл CSV в Excel, и все данные попадают в первый столбец.

Причина: Корень проблемы кроется в том, что в Ваших региональных и языковых настройках Windows и в Вашем файле CSV установлены различные разделители. В Северной Америке и некоторых других странах разделителем полей списка по умолчанию является запятая. В то время как в Европейских странах запятая используется как разделитель десятичных разрядов, а разделителем полей списка является точка с запятой.

Решение: Есть несколько возможных решений этой проблемы. Вы можете быстро просмотреть приведённые ниже рекомендации и выбрать наиболее подходящие для конкретно Вашей задачи.

Укажите правильный разделитель непосредственно в файле CSV. Откройте файл CSV в любом текстовом редакторе (подойдёт даже обычный блокнот) и в первой строке вставьте следующий текст

Обратите внимание, что это должна быть отдельная строка перед любыми другими данными: Чтобы установить разделитель запятую: sep=,
Чтобы установить разделитель точку с запятой: sep=;

Замечание: Все показанные решения изменяют разделитель только для данного файла CSV. Если Вы хотите раз и навсегда изменить разделитель, заданный по умолчанию, то Вам подойдёт следующее решение.

Примечание переводчика: Данные настройки приведены для английской локализации Excel (и ряда других стран). Для русской локализации привычнее будет использовать запятую в качестве разделителя целой и дробной части и точку с запятой для разделения элементов списка.

  1. Дважды нажмите ОК, чтобы закрыть диалоговые окна – всё готово! С этого момента Microsoft Excel будет открывать и отображать все файлы CSV (с разделителем запятой) корректно.

Замечание: Установка в Панели управления Windows символов-разделителей целой и дробной части и элементов списка изменит настройки символов, заданные по умолчанию, для всех программ на Вашем компьютере, а не только в Microsoft Excel.

Первые нули теряются при открытии файла CSV в Excel

Признаки: Ваш файл CSV содержит значения с первыми нулями, и эти нули теряются при открытии файла CSV в Excel.

Причина: По умолчанию, Microsoft Excel отображает файл CSV в формате General (Общий), в котором первые нули отсекаются.

Решение: Вместо того, чтобы открывать файл .csv в Excel, запустите, как мы это делали ранее, Мастер импорта текстов, чтобы конвертировать файл CSV в Excel.

На шаге 3 мастера выберите столбцы, содержащие значения с первыми нулями и измените формат этих столбцов на текстовый. Так Вы конвертируете Ваш файл CSV в Excel, сохранив нули на своих местах.

Excel преобразует некоторые значения в даты при открытии файла CSV

Признаки: Некоторые значения в Вашем файле CSV похожи на даты, и Excel автоматически преобразует такие значения из текстового формата в формат даты.

Решение: Преобразуйте файл CSV в Excel при помощи Мастера импорта текстов. На шаге 3 мастера выберите столбцы с записями, похожими на даты, и измените формат столбца на текстовый.

Если Вам нужно достичь противоположного результата, то есть в определённом столбце преобразовать значения в даты, тогда установите формат Date (Дата) и выберите подходящий формат даты в выпадающем списке.

Открытие файла формата CSV в Microsoft Excel

Текстовые документы формата CSV применяются многими компьютерными программами для обмена данными между друг другом. Казалось бы, что в Экселе можно произвести запуск такого файла стандартным двойным кликом по нему левой кнопкой мыши, но далеко не всегда в таком случае данные отображаются корректно. Правда, есть другой способ просмотреть информацию, содержащуюся в файле CSV. Давайте узнаем, как это можно сделать.

Открытие документов CSV

Название формата CSV является аббревиатурой наименования «Comma-Separated Values», что переводится на русский язык, как «значения, разделенные запятыми». Действительно, в этих файлах в качестве разделителей выступают запятые, хотя в русскоязычных версиях, в отличие от англоязычных, все-таки принято применять точку с запятой.

При импорте файлов CSV в Эксель актуальной является проблема воспроизведения кодировки. Зачастую документы, в которых присутствует кириллица, запускаются с текстом изобилующим «кракозябрами», то есть, нечитаемыми символами. Кроме того, довольно частой проблемой является вопрос несоответствия разделителей. В первую очередь, это касается тех ситуаций, когда мы пытаемся открыть документ, сделанный в какой-то англоязычной программе, Экселем, локализованном под русскоязычного пользователя. Ведь в исходнике разделителем является запятая, а русскоязычный Excel воспринимает в этом качестве точку с запятой. Поэтому опять получается некорректный результат. Мы расскажем, как решить и эти проблемы при открытии файлов.

Способ 1: Обычное открытие файла

Но вначале мы остановимся на варианте, когда документ CSV создан в русскоязычной программе и уже готов для открытия в Эксель без дополнительных манипуляций над содержимым.

Если программа Excel уже является установленной для открытия документов CSV на вашем компьютере по умолчанию, то в этом случае достаточно кликнуть по файлу двойным щелчком левой кнопки мыши, и он откроется в Экселе. Если же связь ещё не установлена, то в этом случае нужно выполнить ряд дополнительных манипуляций.

  1. Находясь в Проводнике Windows в той директории, где расположен файл, кликаем правой кнопкой мыши по нему. Запускается контекстное меню. Выбираем в нем пункт «Открыть с помощью». Если в дополнительном открывшемся списке имеется наименование «Microsoft Office», то кликаем по нему. После этого документ просто запустится в вашем экземпляре Экселя. Но, если данного пункта вы не обнаружите, то щелкайте по позиции «Выбрать программу».

C:\Program Files\Microsoft Office\Office№

После этого содержимое документа CSV будет открыто в Экселе. Но данный способ подойдет исключительно в том случае, если не будет проблем с локализацией или с отображением кириллицы. К тому же, как мы видим, придется выполнить некоторое редактирование документа: так как информация не во всех случаях вмещается в текущий размер ячеек, их нужно расширять.

Способ 2: использование Мастера текстов

Импортировать данные из документа формата CSV можно при помощи встроенного инструмента Excel, который называется Мастер текстов.

  1. Запускаем программу Эксель и переходим во вкладку «Данные». На ленте в блоке инструментов «Получение внешних данных» щелкаем по кнопке, которая называется «Из текста».

Способ 3: открытие через вкладку «Файл»

Существует также способ открыть документ CSV через вкладку «Файл» программы Excel.

  1. Запускаем Excel и перемещаемся во вкладку «Файл». Щелкаем по пункту «Открыть», расположенному в левой части окна.

Как видим, несмотря на некоторые проблемы с открытием документов формата CSV в Экселе, решить их все-таки можно. Для этого нужно воспользоваться встроенным инструментом Excel, который называется Мастер текстов. Хотя, для многих случаев вполне достаточно и применения стандартного метода открытия файла двойным щелчком левой кнопки мыши по его наименованию.

Мы рады, что смогли помочь Вам в решении проблемы.

Помимо этой статьи, на сайте еще 12345 инструкций. Добавьте сайт Lumpics.ru в закладки (CTRL+D) и мы точно еще пригодимся вам.

Опишите, что у вас не получилось. Наши специалисты постараются ответить максимально быстро.

Экспортируем из Excel в CSV с кодировкой UTF-8 или UTF-16

Если на листе Excel содержатся какие-либо специальные или иностранные символы (тильда, ударение и подобные) или иероглифы, то преобразование листа Excel в CSV описанным выше способом не сработает.

Дело в том, что команда Сохранить как
> CSV
(Save as > CSV) исказит все символы, кроме ASCII (American Standard Code for Information Interchange). И если на листе Excel есть парные кавычки или длинные тире (перенесённые в Excel, например, из документа Word при копировании / вставке текста) – такие символы также будут искромсаны.

  • UTF-8
    – это более компактная кодировка, использующая для каждого символа от 1 до 4 байт. Чаще всего рекомендуется использовать этот формат, когда символы ASCII преобладают в файле, т.к. большинство таких символов требует 1 байт памяти. Ещё одно преимущество в том, что кодировка файла UTF-8, содержащего только символы ASCII, ничем не будет отличаться от такого же ASCII-файла.
  • UTF-16
    использует от 2 до 4 байт для хранения каждого символа. Учтите, что не во всех случаях файл UTF-16 требует больше места в памяти, чем файл UTF-8. Например, японские символы занимают от 3 до 4 байт в UTF-8 и от 2 до 4 байт в UTF-16. Таким образом, есть смысл использовать UTF-16, если данные содержат азиатские символы, в том числе Японские, Китайские и Корейские. Существенный недостаток этой кодировки в том, что она не полностью совместима с ASCII-файлами и требуются специальные программы для отображения таких файлов. Помните об этом, если планируете импортировать получившиеся файлы из Excel куда-то ещё.

Как преобразовать файл Excel в CSV UTF-8

Предположим, у нас есть лист Excel с иностранными символами, в нашем примере – это японские имена.

Чтобы экспортировать этот лист Excel в файл CSV, сохранив при этом все иероглифы, сделаем следующее:

Замечание:
Не все простые текстовые редакторы полностью поддерживают символы Юникод, поэтому некоторые из них могут отображаться как прямоугольники

В большинстве случаев, это никак не повлияет на итоговый файл, и можно просто не обращать на это внимание или выбрать более продвинутый редактор, например, Notepad++

  1. Так как в нашем текстовом Юникод файле в качестве разделителей используется символ табуляции, а мы хотим преобразовать его в CSV (разделители – запятые), то необходимо заменить символы табуляции на запятые.

Замечание:
Если нет строгой необходимости получить файл именно с разделителями – запятыми, а нужен любой файл CSV, который Excel сможет понять, то этот шаг можно пропустить, так как Microsoft Excel отлично понимает файлы с разделителем – табуляцией.

Замечание:
Если Ваш файл предназначен для использования за пределами Excel и формат UTF-8 является обязательным требованием, то не совершайте на листе никаких изменений и не сохраняйте его снова в Excel, поскольку это может привести к проблемам с чтением кодировки. Если какая-то часть данных не отображается в Excel, откройте тот же файл в Блокноте и в нём внесите исправления в данные. Не забудьте снова сохранить файл в формате UTF-8.

Как преобразовать файл Excel в CSV UTF-16

Экспортировать в файл CSV UTF-16 намного быстрее и проще, чем в UTF-8. Дело в том, что Excel автоматически применяет формат UTF-16 при сохранении файла как Текст Юникод
(Unicode Text).

Для этого сохраняем файл при помощи инструмента Сохранить как
(Save as) в Excel и затем в Проводнике Windows изменяем расширение созданного файла на .csv
. Готово!

Если нужен файл CSV с запятой или точкой с запятой в качестве разделителя, замените все символы табуляции на запятые или точки с запятой соответственно в Блокноте или в любом другом текстовом редакторе на свой выбор (ранее в этой статье есть подробная инструкция, как это делается).

Как открыть CSV в Excel

Перейдем к примеру, в котором рассмотрим, как открыть CSV файл в Excel. Пусть у нас есть файл CSV формата, который будет выглядеть следующим образом, если его просто открыть с помощью Excel или другого текстового редактора.

Как открыть CSV в Excel – Неформатированный файл CSV в Excel

Для того чтобы представить данные из CSV файла в удобном виде, в виде таблицы, необходимо импортировать файл CSV в Excel. Разберем как вставить данные из CSV файла в открытую рабочую книгу Excel.

  1. Перейдите во вкладку « Данные », и в группе « Получение внешних данных » выберите пункт « Из текста ».
Как открыть CSV в Excel – Получение внешних данных из текста в Excel
  1. В открывшемся окне найдите в вашем компьютере CSV файл, который хотите открыть в Excel. Выберите его и нажмите кнопку «Импорт» либо дважды кликните по файлу.
Как открыть CSV в Excel – Импорт CSV файла в Excel
  1. Далее появится окно мастера импорта текстов.

Шаг 1. В поле « Формат исходных данных » у нас должен быть выбран пункт «с разделителями», так как в текстовом файле CSV элементы разделены запятыми.

В поле « Начать импорт со строки » мы указываем номер первой строки импортируемых данных. В нашем случае начнем с первой строки. И нажимаем кнопку « Далее ».

Как открыть CSV в Excel – Импорт CSV файла. Шаг 1
  1. Шаг 2. На втором этапе мы выбираем разделители и ограничители строк.

В поле « Символом-разделителем является :» мы выбираем символ, который разделяет значения в текстовом файле CSV. В нашем случае это запятая. Если в вашем CSV файле разделителями выступают другие символы, или он отсутствует в списке, то выбирайте пункт « другой :» и введите его в поле.

В поле « Ограничитель строк » мы выбираем “ . Нажимаем кнопку « Далее ».

Как открыть CSV в Excel – Импорт CSV файла. Шаг 2

Когда разделителем выступает запятая (,), а ограничитель строк – кавычки («), текст «Иванов, бухгалтер» будет импортирован в Excel в одну ячейку как Иванов, бухгалтер. Если ограничителем строк выступает одинарная кавычка или он не задан, то текст «Иванов, бухгалтер», импортированный в Excel будет разбит на две ячейки как «Иванов», «бухгалтер «.

  1. Шаг 3. В группе « Формат данных столбца » задаем формат данных для каждого столбца в предпросмотре « Образец разбора данных ».
Как открыть CSV в Excel – Импорт CSV файла. Шаг 3

В случае, если какой-то столбец не нужно импортировать из CSV файла выберите пункт пропустить .

Как открыть CSV в Excel – Пропустить столбец при импорте CSV в Excel

Нажимаем кнопку « Готово ».

  1. После мастера импорта текста появится окно «Импорт данных»:
Как открыть CSV в Excel – Окно «Импорт данных»

В группе « Куда следует поместить данные » выбираем расположение наших импортируемых данных из CSV в Excel. Если выбираем поле « Имеющийся лист », то указываем адрес ячейки. А если хотим расположить на новом листе, то – пункт « Новый лист ». Мы выберем « Имеющийся лист ». Нажимаем кнопку « ОК ».

В итоге мы получили вот такую таблицу:

Как открыть CSV в Excel – CSV файл в Excel

Ну вот и все, теперь вы с легкостью можете открыть CSV в Excel, и далее работать с полученными табличными данными привычными инструментами MS Excel.

Проблема экспорта ПЗ из Google вебмастер

Многие из нас используют Google инструмент для веб-мастеров только для добавления сайта. Это неправильно, здесь есть масса полезной информации, например список поисковых запросов, по которым пользователи находят и заходят на сайт. Смотрите отчет: Поисковый трафик > Поисковые запросы – предварительно выбрав нужный сайт в списке.

Здесь же есть и экспорта данных в CSV-формате, с возможностью его открытия в Google Таблицы (онлайн аналог Excel) . Ищите кнопку «Загрузить эту таблицу». К слову, количество отображаемых запросов на странице не влияет на полноту экспортируемых данных.

Проблема в том, что в CSV-файле используется разделитель запятой и кодировка UTF-8. Так что даже в Google Таблицы, вместо кириллицы, вы получите только набор вопросов.

Другими словами, нам нужно изменить кодировку на ANSI. А для открытия файла CSV в Excel заменить и разделитель запятой (,) на символ точки с запятой (;) .

Импорт из папки

Источником в Power Query могут быть не только отдельные файлы, но и целая папка со всем ее содержимым. Далее дело следующей техники.

Создадим папку Данные о продажах csv и поместим в нее сразу три файла за январь, февраль и март. Сделаем запрос к этой папке Данные – Скачать и преобразовать – Создать запрос – Из папки. В следующем окне указываем путь. Адрес лучше заранее скопировать и затем вставить, чем искать в проводнике. В редакторе Power Query мы увидим такую таблицу.

Выглядит подозрительно, т.к. вместо данных что-то непонятное. Действительно, сейчас видны только файлы, содержащиеся в папке, и информация о них: название, расширение, время создания, изменения и т.д. Переходим к извлечению данных из этих файлов.

Следующий шаг не является обязательным, но он позволит избежать некоторых возможных проблем в будущем. Нужно понимать, что все содержимое указанной папки будет извлечено с помощью запроса Power Query. И если туда попадет какой-нибудь, например, файл Excel, то запрос «поломается» и выдаст ошибку. Поэтому опытные пользователи создают «защиту», чтобы файлы с другим расширением отфильтровывались.

Идея в том, чтобы в столбце Extension поставить фильтр на расширение .csv. Чтобы случайно не отфильтровать файлы .CSV, сделаем все буквы для столбца Extension маленькими. Для этого выделяем столбец, далее через правую кнопку мыши Преобразование – нижний регистр. Переходим к установке фильтра. Если в выпадающем списке фильтра поставить переключатель на значение .csv, то у нас ничего не получится, т.к. при единственном типе файлов будет автоматически выделен пункт Выбрать все. Поэтому выбираем Текстовые фильтры – Равно… и указываем .csv (обязательно с точкой впереди).

Теперь случайное добавление в указанную папку файлов Excel не повлияет на работу запроса. Этот шаг, повторюсь, необязательный, но лучше прислушаться к совету опытных пользователей.

Приступим к извлечению данных. Содержимое файлов скрыто в колонке Content за значением Binary.

Перед тем, как развернуть содержимое этого столбца, избавимся от лишней информации. Выделяем столбец Content и через правую кнопку мыши выбираем Удалить другие столбцы.

Наступило время сеанса магии с разоблачением. В верхнем правом углу находится кнопка с двумя стрелками, направленными вниз.

Это кнопка загрузки двоичного (бинарного) файла. Жмем. И о чудо! Содержимое всех трех файлов один за другим выгружается в единую таблицу.

Однако на этот раз потребуется вручную внести некоторые корректировки.

• Удалим последний шаг Измененный тип

• Преобразование – Использовать первую строку в качестве заголовков

• Правой кнопкой мыши по полю Дата – Тип изменения – Дата

• Удерживая Shift, выделяем два столбца Наименование и Менеджер, затем через правую клавишу мыши Тип изменения – Текст

• Через Shift выделяем остальные столбцы Цена, Стоимость, Комиссия – правая клавиши мыши – Тип изменения – Десятичное число

• Правой кнопкой мыши по полю Дата – Удалить ошибки

• Главная – Закрыть – Закрыть и загрузить

Таким образом, мы получаем таблицу с единым заголовком, сделанную из трех файлов. На ее основе создадим сводную таблицу.

Сводная таблица построена по 116 строкам. Таким же образом можно было бы объединить и 10 файлов с сотнями тысяч строк.

Настройка Excel для получения данных с SQL сервера

Настройка, делается достаточно просто, но требует определенных навыков и консультации администратора SQL сервера. Вы, конечно, можете попросить программиста настроить Excel на работу или сделать это сами, просто спросив пару пунктов, а каких мы сейчас узнаем.

И первое что нам нужно сделать, это конечно открыть Excel 2010. Затем перейти на вкладку «Данные» и нажать на кнопку «Из других источников» и выбрать «С сервера SQL Server»

Затем у Вас откроется окно «Мастер подключения данных» в котором Вам необходимо, указать на каком сервере располагается база данных и вариант проверки подлинности. Вот именно это Вам придется узнать у администратора баз данных, а если Вы и есть администратор, то заполняйте поля и жмите «Далее».

  • Имя сервера – это адрес Вашего сервера, здесь можно указывать как ip адрес так и DNS имя, в моем случае сервер расположен на этом же компьютере поэтому я и указал localhost;
  • Учетные данные – т.е. это логин и пароль подключения к серверу, здесь возможно два варианта, первый это когда в сети Вашей организации развернута Active directory (Служба каталогов или домен), то в этом случае можно указать, что использовать те данные, под которыми Вы загрузили компьютер, т.е. доступы доменной учетки, и в этом случае никаких паролей здесь вводить не надо, единственное замечание что и на MSSql сервере должна стоять такая настройка по проверки подлинности. У меня именно так и настроено, поэтому я и выбрал этот пункт. А второй вариант, это когда администратор сам заводит учетные данные на SQL сервере и выдает их Вам, и в этом случае он должен их Вам предоставить.

В следующем окне нам предложат задать имя файла подключения, название и описание, я например, написал вот так:

После того как Вы нажмете «Готово» у Вас откроется окно импорта этих данных, где можно указать в какие ячейки копировать данные, я например, по стандарту выгружу данные, начиная с первой ячейки, и жмем «ОК»:

В итоге у меня загрузятся из базы вот такие данные:

Т.е. в точности как в базе. Теперь когда, например, изменились данные в этой таблице, и Вы хотите выгрузить их повторно Вам не нужно повторять все заново, достаточно в excel перейти на вкладку «Данные» нажать кнопку «Существующие подключения» и выбрать соответствующее, т.е. то которое Вы только что создали.

Вот собственно и все, как мне кажется все достаточно просто.

Таким способом получать данные в Excel из базы SQL сервера очень удобно и главное быстро, надеюсь, Вам пригодятся эти знания полученные в сегодняшнем уроке. Удачи!

Добавление в запрос новых файлов и обновление сводной таблицы

Через два месяца в наше распоряжение поступило еще два файла с данными за апрель и май. Их также требуется добавить в сводную таблицу.

И вот здесь наступает момент истины. Все что нужно, это закинуть новые файлы в указанную папку и на ленте во вкладке Данные нажать Обновить все. Первое нажатие обновит все запросы, второе – сводные таблицы.

Power Query вновь обратился в папку по указанному адресу, затащил к себе все файлы, раскрыл их, повторил все шаги обработки и выгрузил в Excel. Второе нажатие кнопки обновило сводную таблицу.

Следует только помнить, что для объединения подобным образом таблиц из разных текстовых файлов необходимо полное совпадение заголовков, иначе они автоматически разведутся по разным столбцам.

Серия видеоуроков о Power Query.

8 ответов

65

При открытии CSV-файлов Excel будет использовать региональный параметр системы, называемый , чтобы определить, какой разделитель по умолчанию использовать.

В Windows вы можете изменить параметр в , как указано в веб-сайт поддержки Office :

Примечание : это работает только в том случае, если десятичный символ также не обозначен как запятая (в соответствии с цитированием Википедии выше). Если это так, Excel будет not использовать запятую как разделитель List, даже если она выбрана. Для многих регионов, не входящих в США, запятая является десятичным символом по умолчанию.

В Mac OS X этот параметр, как представляется, выводится из установки десятичного разделителя (в Language & Region Системные настройки , перейдите в Дополнительно ). Если Decimal Separator является точкой, то разделитель CSV по умолчанию будет запятой, но если Decimal Separator является запятой, то разделитель CSV по умолчанию будет точкой с запятой.

Как вы сами сказали в комментарии, есть альтернатива для пользователей Mac, чтобы быстро просмотреть эти файлы CSV. Это плагин для Quick Look , называемый quicklook-csv , который обрабатывает обнаружение разделителей.

73

Если вы не хотите изменять формат файла и ТОЛЬКО для таргетинга на Excel, вы можете использовать следующий трюк Excel, который поможет вам.

Добавьте новую строку вверху файла с текстом (включая кавычки), чтобы Excel мог открыть файл с помощью «,» в качестве разделителя списков.

Это очень простой трюк, чтобы не менять региональные настройки Windows и получать согласованный результат. Но это особый характер Excel.

9

Вам не нужны кавычки вокруг — пока это первая строка файла, в которой он будет работать, по крайней мере, с Excel 2016.

Я обнаружил, что если файл имеет разделитель табуляции, отлично работает с кавычками и без них.

1

Если разделитель в региональных настройках не является запятой, а точкой с запятой (голландский разделитель), переименуйте файл CSV в файл TXT. Щелкните правой кнопкой мыши файл TXT и выберите «Открыть с помощью» и выберите «Excel». В Excel выберите первый столбец, выберите данные в ленте и разделите текст на столбцы.

ИЛИ

Установите LibreOffice и откройте файл CSV с помощью LibreOffice Calc.

Обязательно проверьте CSV-файл в простом редакторе, например «Блокнот», чтобы убедиться, что он правильно отформатирован.

Я добавил этот ответ после того, как я решил глупую ошибку, в которой файлы CSV, созданные мной с помощью VB, не были открыты с отдельными столбцами в Excel. Я обнаружил, что так, как я написал строки, завернутые в каждую строку кавычками. Excel спрятал кавычки и показал всю строку в столбце A, создавая впечатление, что он игнорирует мои разделители запятой.

лучший способ — сохранить его в текстовом файле с расширением csv

Для голландцев у меня возникла проблема, что Excel 2008 в Windows 7 не придерживался RFC4180:

Файл с разделенной запятой правильно имел поля с запятой (голландский десятичный разделитель), заключенный в двойные кавычки. В голландском языке десятичный разделитель и разделитель списков , поэтому Excel не смог прочитать файл с , используемый для обоих (даже не после явного изменения разделителя списков на в панели управления).

Вход выглядит следующим образом:

Решение было задано @ user280725:

Используйте Блокнот для вставки в качестве первой строки:

(Это означает, что Примечание пользователя @zakinster в его решении больше не требуется применять.)

Интересно: если файл csv все еще загружен, если теперь вы установите локаль на US English на панели управления и сохраните файл, он будет преобразован в формат US English (запятая в качестве разделителя списков и точка в виде десятичного разделителя).

Принятый ответ правильный, но я визуальный человек. Вот каждый шаг в скриншоте, как это сделать в Windows 10.

Видео инструкция

Несмотря на популярность формата при открытии этих данных в Excel начинаются проблемы — Excel изменяет содержимое ячеек еще до того, как вы его увидите! Он обрезает нули у артикулов, превращает штрих-коды и числовые данные в даты, обрезает длину описаний и ведет себя как сырой продукт из-за автоматического форматирования данных! И самое печальное в этой истории — это никак не отключить. Это фундаментальная неграмотность разработчиков, ведь данные должны открываться как есть и без нашего разрешения/действия меняться не должны.

И вроде бы в программе есть импорт CSV, где можно выбрать кодировку и разделители, но файлы открываются все равно криво и исправления мы вряд ли дождемся.

Все, кого это коснулось — действуйте, эти разработчики думают что проблема только у единиц, поэтому кликайте кнопку ниже и напишите свое мнение на официальном форуме.

Не стесняемся английского — используем переводчик Яндекса.

Если Excel убирает нули артикулов и цифр и искажает данные CSV

Из-за недостаточного внимания к этой проблеме пришлось решать ее самостоятельно. Хотя можно было добавить в настройки Excel отключение функции автоматического форматирования. Причем по умолчанию автоформатирование должно быть отключено т.к. мне сложно представить мазохиста, которому это нужно.

Excel и utf-8: файл CSV открывается с каракулями в кодировке юникода

Это очень частая проблема открытия CSV в Excel. Проблема в том, что эксель работает только с кириллической кодировкой Windows-1251. В некоторых CMS, например в CS-Cart экспорт производится только в кодировке UTF-8, из за чего работа с файлом в Excel становится невозможной. Чтобы постоянно не менять кодировку файла «на коленках» и исключить вероятность ошибки по невнимательности при работе с большим количеством файлов мы обновили надстройку, приложенную ниже. Теперь перед импортом CSV файла вы можете выбрать кодировку.

Функции надстройки:

  1. Возможность выбирать разделители
  2. Возможность выбора кодировки открываемого файла
  3. Открытие ячеек в текстовом формате, без искажения данных
  4. Контроль правильности разбивки ячеек

Установка очень простая — открываем файл, разрешаем редактирование файла и кликаем по большой красной кнопке «Установить надстройку».

После этого в верхней части программы Excel появится вкладка «Надстройки», в которой будет 3 пункта — для открытия CSV файла и для смены кодировки и разделителей открываемого CSV файла.

Обратите внимание что все CSV файлы нужно открывать только через кнопку «Открыть CSV»

Понравилась статья? Поделиться с друзьями:
Самоучитель Брин Гвелл
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: