Каталог расширений

Популярные теги

3gp       avi       fb2       jpg       mp3       pdf      

Как сохранить csv файл


Как преобразовать файлы Excel в формат CSV

CSV (Comma Separated Values) – распространённый формат для хранения табличных данных (числовых и текстовых) в виде простого текста. Этот формат файлов популярен и живуч благодаря тому, что огромное количество программ и приложений понимают CSV, хотя бы как альтернативный вариант файлового формата для импорта / экспорта. Более того, формат CSV позволяет пользователю заглянуть в файл и немедленно найти проблему с данными, если таковая имеется, изменить разделитель CSV, правила цитирования и так далее. Это возможно потому, что CSV – это простой текст, и даже не очень опытный пользователь, сможет легко его понять без специальной подготовки.

В этой статье мы изучим быстрые и эффективные способы экспорта данных из Excel в CSV и узнаем, как преобразовать файл Excel в CSV, сохранив без искажений все специальные и иностранные символы. Описанные в статье приёмы работают во всех версиях Excel 2013, 2010 и 2007.

Как преобразовать файл Excel в CSV

Если требуется экспортировать файл Excel в какое-либо другое приложение, например, в адресную книгу Outlook или в базу данных Access, предварительно преобразуйте лист Excel в файл CSV, а затем импортируйте файл .csv в другое приложение. Ниже дано пошаговое руководство, как экспортировать рабочую книгу Excel в формат CSV при помощи инструмента Excel – «Сохранить как».

  1. В рабочей книге Excel откройте вкладку Файл (File) и нажмите Сохранить как (Save as). Кроме этого, диалоговое окно Сохранение документа (Save as) можно открыть, нажав клавишу F12.
  2. В поле Тип файла (Save as type) выберите CSV (разделители – запятые) (CSV (Comma delimited)).Кроме CSV (разделители – запятые), доступны несколько других вариантов формата CSV:
    • CSV (разделители – запятые) (CSV (Comma delimited)). Этот формат хранит данные Excel, как текстовый файл с разделителями запятыми, и может быть использован в другом приложении Windows и в другой версии операционной системы Windows.
    • CSV (Macintosh). Этот формат сохраняет книгу Excel, как файл с разделителями запятыми для использования в операционной системе Mac.
    • CSV (MS-DOS). Сохраняет книгу Excel, как файл с разделителями запятыми для использования в операционной системе MS-DOS.
    • Текст Юникод (Unicode Text (*txt)). Этот стандарт поддерживается почти во всех существующих операционных системах, в том числе в Windows, Macintosh, Linux и Solaris Unix. Он поддерживает символы почти всех современных и даже некоторых древних языков. Поэтому, если книга Excel содержит данные на иностранных языках, то рекомендую сначала сохранить её в формате Текст Юникод (Unicode Text (*txt)), а затем преобразовать в CSV, как описано далее в разделе Экспортируем из Excel в формат CSV UTF-8 или UTF-16.

Замечание: Все упомянутые форматы сохраняют только активный лист Excel.

  1. Выберите папку для сохранения файла в формате CSV и нажмите Сохранить (Save).После нажатия Сохранить (Save) появятся два диалоговых окна. Не переживайте, эти сообщения не говорят об ошибке, так и должно быть.
  2. Первое диалоговое окно напоминает о том, что В файле выбранного типа может быть сохранён только текущий лист (The selected file type does not support workbooks that contain multiple sheets). Чтобы сохранить только текущий лист, достаточно нажать ОК.Если нужно сохранить все листы книги, то нажмите Отмена (Cancel) и сохраните все листы книги по-отдельности с соответствующими именами файлов, или можете выбрать для сохранения другой тип файла, поддерживающий несколько страниц.
  3. После нажатия ОК в первом диалоговом окне, появится второе, предупреждающее о том, что некоторые возможности станут недоступны, так как не поддерживаются форматом CSV. Так и должно быть, поэтому просто жмите Да (Yes).

Вот так рабочий лист Excel можно сохранить как файл CSV. Быстро и просто, и вряд ли тут могут возникнуть какие-либо трудности.

Экспортируем из Excel в CSV с кодировкой UTF-8 или UTF-16

Если на листе Excel содержатся какие-либо специальные или иностранные символы (тильда, ударение и подобные) или иероглифы, то преобразование листа Excel в CSV описанным выше способом не сработает.

Дело в том, что команда Сохранить как > CSV (Save as > CSV) исказит все символы, кроме ASCII (American Standard Code for Information Interchange). И если на листе Excel есть парные кавычки или длинные тире (перенесённые в Excel, например, из документа Word при копировании / вставке текста) – такие символы также будут искромсаны.

Простое решение – сохранить лист Excel как текстовый файл Unicode(.txt), и затем преобразовать его в CSV. Таким образом все символы, не входящие в ASCII, останутся в целости и сохранности.

Прежде чем двинуться дальше, позвольте мне кратко пояснить главные отличия между кодировками UTF-8 и UTF-16, чтобы в каждом индивидуальном случае Вы могли выбрать подходящий формат:

  • UTF-8 – это более компактная кодировка, использующая для каждого символа от 1 до 4 байт. Чаще всего рекомендуется использовать этот формат, когда символы ASCII преобладают в файле, т.к. большинство таких символов требует 1 байт памяти. Ещё одно преимущество в том, что кодировка файла UTF-8, содержащего только символы ASCII, ничем не будет отличаться от такого же ASCII-файла.
  • UTF-16 использует от 2 до 4 байт для хранения каждого символа. Учтите, что не во всех случаях файл UTF-16 требует больше места в памяти, чем файл UTF-8. Например, японские символы занимают от 3 до 4 байт в UTF-8 и от 2 до 4 байт в UTF-16. Таким образом, есть смысл использовать UTF-16, если данные содержат азиатские символы, в том числе Японские, Китайские и Корейские. Существенный недостаток этой кодировки в том, что она не полностью совместима с ASCII-файлами и требуются специальные программы для отображения таких файлов. Помните об этом, если планируете импортировать получившиеся файлы из Excel куда-то ещё.

Как преобразовать файл Excel в CSV UTF-8

Предположим, у нас есть лист Excel с иностранными символами, в нашем примере – это японские имена.

Чтобы экспортировать этот лист Excel в файл CSV, сохранив при этом все иероглифы, сделаем следующее:

  1. В Excel откройте вкладку Файл (File) и нажмите Сохранить как (Save as).
  2. Введите имя файла, в поле Тип файла (Save as type) выберите Текст Юникод (Unicode Text (*.txt)) и нажмите Сохранить (Save).
  3. Откройте созданный файл в любом стандартном текстовом редакторе, например, в Блокноте.

Замечание: Не все простые текстовые редакторы полностью поддерживают символы Юникод, поэтому некоторые из них могут отображаться как прямоугольники. В большинстве случаев, это никак не повлияет на итоговый файл, и можно просто не обращать на это внимание или выбрать более продвинутый редактор, например, Notepad++.

  1. Так как в нашем текстовом Юникод файле в качестве разделителей используется символ табуляции, а мы хотим преобразовать его в CSV (разделители – запятые), то необходимо заменить символы табуляции на запятые.

Замечание: Если нет строгой необходимости получить файл именно с разделителями – запятыми, а нужен любой файл CSV, который Excel сможет понять, то этот шаг можно пропустить, так как Microsoft Excel отлично понимает файлы с разделителем – табуляцией.

  1. Если всё же нужен файл CSV (разделители – запятые), то выполните в Блокноте следующие действия:
    • Выделите символ табуляции, кликните по нему правой кнопкой и в контекстном меню нажмите Копировать (Copy), или просто нажмите Ctrl+C, как показано на рисунке ниже.
    • Нажмите Ctrl+H, чтобы открылось диалоговое окно Заменить (Replace) и вставьте скопированный символ табуляции в поле Что (Find what). При этом курсор сместится вправо – это значит, что символ табуляции вставлен. В поле Чем (Replace with) введите запятую и нажмите Заменить все (Replace all).

    В Блокноте результат будет приблизительно вот такой:

  2. Кликните Файл > Сохранить как (File > Save as), введите имя для файла и в выпадающем списке Кодировка (Encoding) выберите UTF-8. Затем нажмите кнопку Сохранить (Save).
  3. Запустите Проводник Windows и измените расширение файла с .txt на .csv.По-другому изменить расширение .txt на .csv можно непосредственно в Блокноте. Для этого в диалоговом окне Сохранить как (Save as) в поле Тип файла (Save as type) выберите вариант Все файлы (All files), а к имени файла в соответствующем поле добавьте “.csv”, как показано на рисунке ниже.
  4. Откройте файл CSV в Excel, для этого на вкладке Файл (File) нажмите Открыть > Текстовые файлы (Open > Text files) и проверьте в порядке ли данные.

Замечание: Если Ваш файл предназначен для использования за пределами Excel и формат UTF-8 является обязательным требованием, то не совершайте на листе никаких изменений и не сохраняйте его снова в Excel, поскольку это может привести к проблемам с чтением кодировки. Если какая-то часть данных не отображается в Excel, откройте тот же файл в Блокноте и в нём внесите исправления в данные. Не забудьте снова сохранить файл в формате UTF-8.

Как преобразовать файл Excel в CSV UTF-16

Экспортировать в файл CSV UTF-16 намного быстрее и проще, чем в UTF-8. Дело в том, что Excel автоматически применяет формат UTF-16 при сохранении файла как Текст Юникод (Unicode Text).

Для этого сохраняем файл при помощи инструмента Сохранить как (Save as) в Excel и затем в Проводнике Windows изменяем расширение созданного файла на .csv. Готово!

Если нужен файл CSV с запятой или точкой с запятой в качестве разделителя, замените все символы табуляции на запятые или точки с запятой соответственно в Блокноте или в любом другом текстовом редакторе на свой выбор (ранее в этой статье есть подробная инструкция, как это делается).

Другие способы преобразования файлов Excel в CSV

Описанные выше способы экспорта данных из Excel в CSV (UTF-8 и UTF-16) универсальны, т.е. подойдут для работы с любыми специальными символами и в любой версии Excel от 2003 до 2013.

Существует множество других способов преобразования данных из формата Excel в CSV. В отличие от показанных выше решений, эти способы не будут давать в результате чистый UTF-8 файл (это не касается OpenOffice, который умеет экспортировать файлы Excel в несколько вариантов кодировки UTF). Но в большинстве случаев получившийся файл будет содержать правильный набор символов, который далее можно безболезненно преобразовать в формат UTF-8 при помощи любого текстового редактора.

Преобразуем файл Excel в CSV при помощи Таблиц Google

Как оказалось, можно очень просто преобразовать файл Excel в CSV при помощи Таблиц Google. При условии, что на Вашем компьютере уже установлен Google Drive, выполните следующие 5 простых шагов:

  1. В Google Drive нажмите кнопку Создать (Create) и выберите Таблица (Spreadsheet).
  2. В меню Файл (File) нажмите Импорт (Import).
  3. Кликните Загрузка (Upload) и выберите файл Excel для загрузки со своего компьютера.
  4. В диалоговом окне Импорт файла (Import file) выберите Заменить таблицу (Replace spreadsheet) и нажмите Импорт (Import).

Совет: Если файл Excel относительно небольшой, то для экономии времени можно перенести из него данные в таблицу Google при помощи копирования / вставки.

  1. В меню Файл (File) нажмите Скачать как (Download as), выберите тип файла CSV – файл будет сохранён на компьютере.

В завершение откройте созданный CSV-файл в любом текстовом редакторе, чтобы убедиться, что все символы сохранены правильно. К сожалению, файлы CSV, созданные таким способом, не всегда правильно отображаются в Excel.

Сохраняем файл .xlsx как .xls и затем преобразуем в файл CSV

Для этого способа не требуется каких-либо дополнительных комментариев, так как из названия уже всё ясно.

Это решение я нашёл на одном из форумов, посвящённых Excel, уже не помню, на каком именно. Честно говоря, я никогда не использовал этот способ, но, по отзывам множества пользователей, некоторые специальные символы теряются, если сохранять непосредственно из .xlsx в .csv, но остаются, если сначала .xlsx сохранить как .xls, и затем как .csv, как мы делали в начале этой статьи.

Так или иначе, попробуйте сами такой способ создания файлов CSV из Excel, и если получится, то это будет хорошая экономия времени.

Сохраняем файл Excel как CSV при помощи OpenOffice

OpenOffice – это пакет приложений с открытым исходным кодом, включает в себя приложение для работы с таблицами, которое отлично справляется с задачей экспорта данных из формата Excel в CSV. На самом деле, это приложение предоставляет доступ к большему числу параметров при преобразовании таблиц в файлы CSV (кодировка, разделители и так далее), чем Excel и Google Sheets вместе взятые.

Просто открываем файл Excel в OpenOffice Calc, нажимаем Файл > Сохранить как (File > Save as) и выбираем тип файла Текст CSV (Text CSV).

На следующем шаге предлагается выбрать значения параметров Кодировка (Character sets) и Разделитель поля (Field delimiter). Разумеется, если мы хотим создать файл CSV UTF-8 с запятыми в качестве разделителей, то выбираем UTF-8 и вписываем запятую (,) в соответствующих полях. Параметр Разделитель текста (Text delimiter) обычно оставляют без изменения – кавычки (“). Далее нажимаем ОК.

Таким же образом для быстрого и безболезненного преобразования из Excel в CSV можно использовать ещё одно приложение – LibreOffice. Согласитесь, было бы здорово, если бы Microsoft Excel предоставил возможность так же настраивать параметры при создании файлов CSV.

В этой статье я рассказал об известных мне способах преобразования файлов Excel в CSV. Если Вам знакомы более эффективные методы экспорта из Excel в CSV, расскажите об этом в комментариях. Благодарю за внимание!

Оцените качество статьи. Нам важно ваше мнение:

Импорт и экспорт текстовых файлов (в формате TXT или CSV)

Импорт текстового файла путем подключения к нем (Power Query)

Вы можете импортировать данные из текстового файла в существующий файл.

  1. На вкладке "Данные" в группе & "Преобразовать данные" нажмите кнопку "Из текстового/CSV-документа".

  2. В диалоговом окне "Импорт данных" найдите и дважды щелкните текстовый файл, который нужно импортировать, и нажмите кнопку "Импорт".

  3. В диалоговом окне предварительного просмотра есть несколько параметров:

    • Выберите "Загрузить", если вы хотите загрузить данные непосредственно на новый таблицу.

    • Вы также можете выбрать вариант "Загрузить в", если вы хотите загрузить данные в таблицу, в сводная диаграмма или на существующий/новый таблицу Excel, или просто создать подключение. Вы также можете добавить данные в модель данных.

    • Выберите "Преобразовать данные", если вы хотите загрузить данные в Power Query и отредактировать их перед их загрузкой в Excel.

Если Excel не преобразует определенный столбец данных в нужный формат, данные можно преобразовать после импорта. Дополнительные сведения см. в статьях Преобразование чисел из текстового формата в числовой и Преобразование дат из текстового формата в формат даты.

Экспорт данных в текстовый файл путем его сохранения

Лист Excel можно преобразовать в текстовый файл, используя команду Сохранить как.

  1. Выберите Файл > Сохранить как.

  2. Нажмите кнопку Обзор.

  3. В диалоговом окне "Сохранить как" в поле "Тип файла" выберите формат текстового файла для этого таблицы. Например, щелкните "Текст" (с делегированной табулом) или "CSV (с запятой) ".

  4. Перейдите в папку, куда вы хотите сохранить файл, а затем нажмите кнопку Сохранить.

  5. Откроется диалоговое окно с напоминанием о том, что в текстовом файле будет сохранен только текущий лист. Если вы хотите сохранить именно текущий лист, нажмите кнопку ОК. Другие листы можно сохранить в отдельных текстовых файлах, повторив эту процедуру для каждого из них.

    Кроме того, под лентой может появиться предупреждение о том, что при сохранение книги в формате CSV некоторые возможности могут быть потеряны.

Дополнительные сведения о сохранении файлов в других форматах см. в статье Сохранение книги в другом формате файла.

Импорт текстового файла путем подключения к нему

Вы можете импортировать данные из текстового файла в существующий файл.

  1. Щелкните ячейку, в которую вы хотите поместить данные из текстового файла.

  2. На вкладке Данные в группе Получение внешних данных нажмите Из текста.

  3. В диалоговом окне "Импорт данных" найдите и дважды щелкните текстовый файл, который нужно импортировать, и нажмите кнопку "Импорт".

    Следуйте инструкциям мастера импорта текста. Нажмите кнопку на любой странице мастера импорта текста, чтобы получить дополнительные сведения об его использовании. Окончив работу с мастером, нажмите кнопку Готово, чтобы завершить импорт.

  4. В диалоговом окне Импорт данных:

    1. В группе Куда следует поместить данные? выполните одно из следующих действий:

      • Чтобы поместить данные в выбранные ячейки, щелкните На существующий лист.

      • Чтобы поместить данные в верхний левый угол нового листа, выберите вариант На новый лист.

    2. При необходимости нажмите кнопку Свойства, чтобы задать параметры обновления, форматирования и макета импортируемых данных.

    3. Нажмите кнопку ОК.

      Excel добавит диапазон внешних данных в указанное место.

Если Excel не преобразует столбец в необходимый формат, это можно сделать после импорта. Дополнительные сведения см. в статьях Преобразование чисел из текстового формата в числовой и Преобразование дат из текстового формата в формат даты.

Экспорт данных в текстовый файл путем его сохранения

Лист Excel можно преобразовать в текстовый файл, используя команду Сохранить как.

  1. Выберите Файл > Сохранить как.

  2. Откроется диалоговое окно Сохранение документа.

  3. В поле Тип файла выберите формат текстового файла для листа.

    • Например, выберите Текстовые файлы (с разделителями табуляции) или CSV (разделители — запятые).

  4. Перейдите в папку, куда вы хотите сохранить файл, а затем нажмите кнопку Сохранить.

  5. Откроется диалоговое окно с напоминанием о том, что в текстовом файле будет сохранен только текущий лист. Если вы хотите сохранить именно текущий лист, нажмите кнопку ОК. Другие листы можно сохранить в отдельных текстовых файлах, повторив эту процедуру для каждого из них.

  6. Откроется второе диалоговое окно с напоминанием о том, что сохраняемый лист может содержать возможности, которые не поддерживаются текстовыми форматами файлов. Если в новом текстовом файле нужно сохранить только данные листа, нажмите кнопку Да. Если вы не уверены и хотите получить дополнительные сведения о том, какие возможности Excel не поддерживаются форматами текстовых файлов, нажмите кнопку Справка.

Дополнительные сведения о сохранении файлов в других форматах см. в статье Сохранение книги в другом формате файла.

Создание и изменение CSV-файлов для импорта в Outlook

CSV-файлы (файлы данных с разделителями-запятыми) — это файлы особого типа, которые можно создавать и редактировать в Excel. В CSV-файлах данные хранятся не в столбцах, а разделенные запятыми. Текст и числа, сохраненные в CSV-файле, можно легко переносить из одной программы в другую. Например, вы можете экспортировать контакты из Google в CSV-файл, а затем импортировать их в Outlook.

Сведения о том, как импортировать список записей календаря в Outlook, см. в статье Импорт и экспорт электронной почты, контактов и календаря Outlook.

Создание CSV-файла из другой программы или службы электронной почты другого поставщика

При экспорте контактов из другой программы, например Gmail, обычно можно выбрать один из нескольких форматов. В Gmail на выбор предлагаются CSV-файл Google, CSV-файл Outlook и файлы vCard. При экспорте данных из профиля Outlook для последующего импорта в другой профиль можно выбрать CSV-файл или файл данных Outlook (PST).

Скачивание и открытие образца CSV-файла для импорта контактов в Outlook

Вы можете создать CSV-файл вручную одним из двух способов.

Создание файла Excel и его сохранение в формате CSV

Если сведения о контактах хранятся в программе, из которой их невозможно экспортировать, вы можете ввести их вручную.

  1. Создайте новый документ в Excel.

  2. Добавьте заголовок столбца для каждого фрагмента сведений, который вы хотите записать (например, для имени, фамилии, адреса электронной почты, номера телефона и дня рождения), а затем введите данные в соответствующие столбцы.

  3. Когда вы закончите, файл Excel должен выглядеть примерно так:

  4. Выберите Файл > Сохранить как.

  5. В раскрывающемся списке выберите пункт "CSV (разделитель — запятая) (*.csv)", присвойте имя файлу и нажмите кнопку Сохранить.

  6. Теперь вы можете использовать этот CSV-файл для импорта контактов в Outlook.

Скачивание шаблона CSV-файла

Если вы хотите начать с пустого CSV-файла, то можете скачать образец ниже.

  1. Скачайте этот образец CSV-файла на свой компьютер. При появлении запроса нажмите кнопку Сохранить и сохраните файл на своем компьютере в формате CSV. Если сохранить файл в формате Excel (XLS или XLSM) все данные будет добавлены в один столбец.

  2. Откройте Excel на компьютере.

  3. В Excel выберите Файл > Открыть и перейдите к CSV-файлу, скачанному на компьютер. Чтобы найти CSV-файл, выберите Все файлы. Щелкните CSV-файл, чтобы открыть его.

При работе с этим CSV-файлом нужно помнить о нескольких вещах.

  • Для Outlook необходимо, чтобы в первой строке находились заголовки столбцов, поэтому не заменяйте их другими данными. 
    Язык заголовков столбцов должен совпадать с языком Outlook, используемым по умолчанию. Например, если в качестве языка Outlook по умолчанию настроен португальский, требуется изменить заголовки столбцов, чтобы они отображались на португальском языке.

  • Вы можете удалить данные из строк 2–6 (например, имена, телефонные номера, адреса электронной почты и т. д).

  • Вводить данные во всех столбцах необязательно. Укажите только необходимые сведения.

  • Сохраните файл в формате CSV под другим именем. Если вы работаете с этим файлом в Excel, то при его сохранении получите несколько запросов такого типа: "Вы действительно хотите сохранить файл в формате CSV?" Всегда выбирайте ответ "Да". Если вы выберете "Нет", файл будет сохранен в собственном формате Excel (XLSX) и его нельзя будет использовать для импорта данных в Outlook.

  • Попробуйте импортировать CSV-файл с несколькими контактами, чтобы убедиться в получении правильных результатов. После этого можно удалить импортированные контакты, добавить все нужные контакты в CSV-файл и снова импортировать его.

    Если вы импортируете данные из образца CSV-файла, вот как это будет выглядеть в Outlook в Интернете для Microsoft 365:

Изменение CSV-файла с контактами, которые нужно импортировать в Outlook

Предположим, вы хотите изменить CSV-файл, экспортированный из Outlook, а затем снова импортировать его в это приложение или другую почтовую службу. Вы можете легко сделать это с помощью Excel.

При изменении CSV-файла учитывайте перечисленные ниже моменты.

  • Заголовки столбцов должны оставаться в первой строке.

  • При сохранении файла в Excel несколько раз появятся запросы такого типа: "Вы действительно хотите сохранить файл в формате CSV?" Всегда выбирайте ответ "Да". Если вы выберете "Нет", файл будет сохранен в собственном формате Excel (XLSX) и его нельзя будет использовать для импорта в Outlook.

Проблема: все данные выводятся в первом столбце

Это могло произойти по нескольким причинам, поэтому можно попробовать несколько решений.

  • Если вы сохраните CSV-файл в другом формате, например XLS, XLSX или XLM, все данные будут отображаться в первом столбце. Вернитесь к исходному CSV-файлу и сохраните его в формате CSV.

  • Возможно, программа, в которой был создан CSV-файл, добавляет к данным дополнительные кавычки, из-за чего Excel считает их одной строкой. Предположим, например, что у вас такие данные:

    a, b, c, d — Excel поместит каждую букву в отдельный столбец.

    "a, b, c, d", e — Excel поместит a, b, c, d в один столбец, а e — в другой.

    Чтобы проверить, не в этом ли проблема, откройте файл в Блокноте: Щелкните CSV-файл правой кнопкой мыши, выберите Открыть с помощью > Блокнот. Выполните поиск дополнительных кавычек.

    Если они есть, вот как можно исправить файл:

    1. Откройте CSV-файл в Excel. Все данные будут добавлены в столбец A без кавычек.

    2. С помощью мастера распределения текста по столбцам разделите данные столбца A на отдельные столбцы: в строке меню выберите Данные > Текст по столбцам.

    3. Выберите С разделителями > Далее. Выберите запятая > Готово.

    4. Сохраните файл в формате CVS, чтобы можно было импортировать его в Outlook.

См. также

Импорт контактов в Outlook

Экспорт контактов из Outlook

Редактируем CSV-файлы, чтобы не сломать данные / Блог компании HFLabs / Хабр

Продукты HFLabs в промышленных объемах обрабатывают данные: адреса, ФИО, реквизиты компаний и еще вагон всего. Естественно, тестировщики ежедневно с этими данными имеют дело: обновляют тест-кейсы, изучают результаты очистки. Часто заказчики дают «живую» базу, чтобы тестировщик настроил сервис под нее.

Первое, чему мы учим новых QA — сохранять данные в первозданном виде. Все по заветам: «Не навреди». В статье я расскажу, как аккуратно работать с CSV-файлами в Excel и Open Office. Советы помогут ничего не испортить, сохранить информацию после редактирования и в целом чувствовать себя увереннее.

Материал базовый, профессионалы совершенно точно заскучают.

Что такое CSV-файлы


Формат CSV используют, чтобы хранить таблицы в текстовых файлах. Данные очень часто упаковывают именно в таблицы, поэтому CSV-файлы очень популярны.


CSV-файл состоит из строк с данными и разделителей, которые обозначают границы столбцов

CSV расшифровывается как comma-separated values — «значения, разделенные запятыми». Но пусть название вас не обманет: разделителями столбцов в CSV-файле могут служить и точки с запятой, и знаки табуляции. Это все равно будет CSV-файл.

У CSV куча плюсов перед тем же форматом Excel: текстовые файлы просты как пуговица, открываются быстро, читаются на любом устройстве и в любой среде без дополнительных инструментов.

Из-за своих преимуществ CSV — сверхпопулярный формат обмена данными, хотя ему уже лет 40. CSV используют прикладные промышленные программы, в него выгружают данные из баз.

Одна беда — текстового редактора для работы с CSV мало. Еще ничего, если таблица простая: в первом поле ID одной длины, во втором дата одного формата, а в третьем какой-нибудь адрес. Но когда поля разной длины и их больше трех, начинаются мучения.


Следить за разделителями и столбцами — глаза сломаешь

Еще хуже с анализом данных — попробуй «Блокнотом» хотя бы сложить все числа в столбце. Я уж не говорю о красивых графиках.

Поэтому CSV-файлы анализируют и редактируют в Excel и аналогах: Open Office, LibreOffice и прочих.

Ветеранам, которые все же дочитали: ребята, мы знаем об анализе непосредственно в БД c помощью SQL, знаем о Tableau и Talend Open Studio. Это статья для начинающих, а на базовом уровне и небольшом объеме данных Excel с аналогами хватает.

Как Excel портит данные: из классики


Все бы ничего, но Excel, едва открыв CSV-файл, начинает свои лукавые выкрутасы. Он без спроса меняет данные так, что те приходят в негодность. Причем делает это совершенно незаметно. Из-за этого в свое время мы схватили ворох проблем.

Большинство казусов связано с тем, что программа без спроса преобразует строки с набором цифр в числа.

Округляет. Например, в исходной ячейке два телефона хранятся через запятую без пробелов: «5235834,5235835». Что сделает Excel? Лихо превратит номера́ в одно число и округлит до двух цифр после запятой: «5235834,52». Так мы потеряем второй телефон.

Приводит к экспоненциальной форме. Excel заботливо преобразует «123456789012345» в число «1,2E+15». Исходное значение потеряем напрочь.

Проблема актуальна для длинных, символов по пятнадцать, цифровых строк. Например, КЛАДР-кодов (это такой государственный идентификатор адресного объекта: го́рода, у́лицы, до́ма).

Удаляет лидирующие плюсы. Excel считает, что плюс в начале строки с цифрами — совершенно лишний символ. Мол, и так ясно, что число положительное, коль перед ним не стоит минус. Поэтому лидирующий плюс в номере «+74955235834» будет отброшен за ненадобностью — получится «74955235834». (В реальности номер пострадает еще сильнее, но для наглядности обойдусь плюсом).

Потеря плюса критична, например, если данные пойдут в стороннюю систему, а та при импорте жестко проверяет формат.

Разбивает по три цифры. Цифровую строку длиннее трех символов Excel, добрая душа, аккуратно разберет. Например, «8 495 5235834» превратит в «84 955 235 834».

Форматирование важно как минимум для телефонных номеров: пробелы отделяют коды страны и города от остального номера и друг от друга. Excel запросто нарушает правильное членение телефона.

Удаляет лидирующие нули. Строку «00523446» Excel превратит в «523446».
А в ИНН, например, первые две цифры — это код региона. Для Республики Алтай он начинается с нуля — «04». Без нуля смысл номера исказится, а проверку формата ИНН вообще не пройдет.

Меняет даты под локальные настройки. Excel с удовольствием исправит номер дома «1/2» на «01.фев». Потому что Windows подсказал, что в таком виде вам удобнее считывать даты.

Побеждаем порчу данных правильным импортом


Если серьезно, в бедах виноват не Excel целиком, а неочевидный способ импорта данных в программу.

По умолчанию Excel применяет к данным в загруженном CSV-файле тип «General» — общий. Из-за него программа распознает цифровые строки как числа. Такой порядок можно победить, используя встроенный инструмент импорта.

Запускаю встроенный в Excel механизм импорта. В меню это «Data → Get External Data → From Text».

Выбираю CSV-файл с данными, открывается диалог. В диалоге кликаю на тип файла Delimited (с разделителями). Кодировка — та, что в файле, обычно определяется автоматом. Если первая строка файла — шапка, отмечаю «My Data Has Headers».

Перехожу ко второму шагу диалога. Выбираю разделитель полей (обычно это точка с запятой — semicolon). Отключаю «Treat consecutive delimiters as one», а «Text qualifier» выставляю в «{none}». (Text qualifier — это символ начала и конца текста. Если разделитель в CSV — запятая, то text qualifier нужен, чтобы отличать запятые внутри текста от запятых-разделителей.)

На третьем шаге выбираю формат полей, ради него все и затевалось. Для всех столбцов выставляю тип «Text». Кстати, если кликнуть на первую колонку, зажать шифт и кликнуть на последнюю, выделятся сразу все столбцы. Удобно.

Дальше Excel спросит, куда вставлять данные из CSV — можно просто нажать «OK», и данные появятся в открытом листе.


Перед импортом придется создать в Excel новый workbook

Но! Если я планирую добавлять данные в CSV через Excel, придется сделать еще кое-что.

После импорта нужно принудительно привести все-все ячейки на листе к формату «Text». Иначе новые поля приобретут все тот же тип «General».

  • Нажимаю два раза Ctrl+A, Excel выбирает все ячейки на листе;
  • кликаю правой кнопкой мыши;
  • выбираю в контекстном меню «Format Cells»;
  • в открывшемся диалоге выбираю слева тип данных «Text».


Чтобы выделить все ячейки, нужно нажать Ctrl+A два раза. Именно два, это не шутка, попробуйте

После этого, если повезет, Excel оставит исходные данные в покое. Но это не самая твердая гарантия, поэтому мы после сохранения обязательно проверяем файл через текстовый просмотрщик.

Альтернатива: Open Office Calc


Для работы с CSV-файлами я использую именно Calc. Он не то чтобы совсем не считает цифровые данные строками, но хотя бы не применяет к ним переформатирование в соответствии с региональными настройками Windows. Да и импорт попроще.

Конечно, понадобится пакет Open Office (OO). При установке он предложит переназначить на себя файлы MS Office. Не рекомендую: хоть OO достаточно функционален, он не до конца понимает хитрое микрософтовское форматирование документов.

А вот назначить OO программой по умолчанию для CSV-файлов — вполне разумно. Сделать это можно после установки пакета.

Итак, запускаем импорт данных из CSV. После двойного клика на файле Open Office показывает диалог.


Заметьте, в OO не нужно создавать новый воркбук и принудительно запускать импорт, все само

  1. Кодировка — как в файле.
  2. «Разделитель» — точка с запятой. Естественно, если в файле разделителем выступает именно она.
  3. «Разделитель текста» — пустой (все то же, что в Excel).
  4. В разделе «Поля» кликаю в левый-верхний квадрат таблицы, подсвечиваются все колонки. Указываю тип «Текст».

Штука, которая испортила немало крови: если по ошибке выбрать несколько разделителей полей или не тот разделитесь текста, файл может правильно открыться, но неправильно сохраниться.

Помимо Calc у нас в HFLabs популярен libreOffice, особенно под «Линуксом». И то, и другое для CSV применяют активнее, чем Excel.

Бонус-трек: проблемы при сохранении из Calc в .xlsx


Если сохраняете данные из Calc в экселевский формат .xlsx, имейте в виду — OO порой необъяснимо и масштабно теряет данные.


Белая пустошь, раскинувшаяся посередине, в оригинальном CSV-файле богато заполнена данными

Поэтому после сохранения я еще раз открываю файл и убеждаюсь, что данные на месте.

Если что-то потерялись, лечение — пересохранить из CSV в .xlsx. Или, если установлен Windows, импортнуть из CSV в Excel и сохранить оттуда.

После пересохранения обязательно еще раз проверяю, что все данные на месте и нет лишних пустых строк.

Если интересно работать с данными, посмотрите на наши вакансии. HFLabs почти всегда нужны аналитики, тестировщики, инженеры по внедрению, разработчики. Данными обеспечим так, что мало не покажется :)

Сохранение книги в текстовом формате (TXT или CSV)

Форматированный текст (разделители — пробелы)

PRN

Формат для Lotus, с разделителями — пробелами. Сохраняет только активный лист

Текст (разделители — знаки табуляции)

TXT

Сохраняет книгу в виде текстового файла, разделенного знаками табуляции, — для использования в другой операционной системе Microsoft Windows — и гарантирует, что символы табуляции, разрывы строк и другие символы будут интерпретироваться правильно. Сохраняет только активный лист.

Текст (Макинтош)

TXT

Сохраняет книгу в виде текстового файла, разделенного знаками табуляции, — для использования в операционной системе Макинтош — и гарантирует, что символы табуляции, разрывы строк и другие символы будут интерпретироваться правильно. Сохраняет только активный лист.

Текст (MS-DOS)

TXT

Сохраняет книгу в виде текстового файла, разделенного знаками табуляции, — для использования в операционной системе MS-DOS — и гарантирует, что символы табуляции, разрывы строк и другие символы будут интерпретироваться правильно. Сохраняет только активный лист.

Текст в кодировке Unicode

TXT

Сохраняет книгу в виде текста в кодировке Unicode, стандартной кодировке символов, разработанном Unicode Consortium.

CSV (разделители — запятые)

CSV

Сохраняет книгу в виде текстового файла, разделенного знаками запятой, — для использования в другой операционной системе Windows — и гарантирует, что символы табуляции, разрывы строк и другие символы будут интерпретироваться правильно. Сохраняет только активный лист.

CSV (Макинтош)

CSV

Сохраняет книгу в виде текстового файла, разделенного знаками запятой, — для использования в операционной системе Макинтош — и гарантирует, что символы табуляции, разрывы строк и другие символы будут интерпретироваться правильно. Сохраняет только активный лист.

CSV (MS-DOS)

CSV

Сохраняет книгу в виде текстового файла, разделенного знаками запятой, — для использования в операционной системе MS-DOS — и гарантирует, что символы табуляции, разрывы строк и другие символы будут интерпретироваться правильно. Сохраняет только активный лист.

DIF

DIF

Формат обмена данными. Сохраняет только активный лист.

SYLK

SLK

Формат Symbolic Link. Сохраняет только активный лист.

Как создать CSV файл через таблицу Excel

Возможность создания CSV файла из таблицы Excel позволяет преобразовывать документы в нужный формат для загрузки в любые системы, например, outlook, Google Analytics, Яндекс.Метрику и многое другое.

Простой способ создания CSV через таблицу в Excel

В качестве примера будет использоваться таблица с данными, которую можно будет скачать ниже.

Для превращения файла в CSV потребуется нажать на кнопку «Файл» (левый-верхний угол).

Далее выбираем пункт «Сохранить как» и нажимаем на «Обзор».

Теперь выбираем нужный формат, например, стандартный CSV.

Все готово, мы получили нужный формат.

Проверив его в блокноте можно увидеть, что разделители стоят «;» (точка с запятой).

Ручной метод превращения таблицы Эксель в CSV-файл

Если требуется создать кастомный файл (с собственными разделителями, например, |). Для этого прописываем конструкцию между каждым элементом:

Далее таким образом соединяем все элементы.

Растягиваем формулу до конца документа.

Выделяем нужный столбец (новый) и правым кликом мыши по нему выводим меню, где нажимаем на «Копировать».

Создаем текстовый документ новый (блокнот), кликнув правой клавишей мыши в нужной папке.

Открываем его и вводим новое поле.

После в левом-верхнем углу кликаем на «Файл»-«Сохранить как».

Выбираем нужный тип кодировки и сохраняем документ.

Важно! Можно сразу выбрать CSV как и в способе №1, дальнейшая инструкция предназначена как дополнительная возможность.

Важно! Лучше всего выбирать UTF-8, что позволит работать в дальнейшем с кириллицей.

Теперь опять кликаем правой клавишей мыши на файл и нажимаем на «Переименовать».

Стираем разрешение «.txt» и прописываем вместо него «.csv». При необходимости меняем название.

Все готово, мы получили нужный формат.

Для чего это нужно?

Создание CSV-файла потребуется для:

Также можно ознакомиться с инструкцией по открытию CSV файла.

Как создать файл CSV

Обновлено: 31.08.2020, Computer Hope

CSV - это простой формат файла, используемый для хранения табличных данных, таких как электронная таблица или база данных. Файлы в формате CSV можно импортировать и экспортировать из программ, хранящих данные в таблицах, таких как Microsoft Excel или OpenOffice Calc.

CSV означает « c omma- s eparated v alues». Его поля данных чаще всего разделяются запятыми.Например, предположим, что у вас есть электронная таблица, содержащая следующие данные.

Имя Класс Общежитие Комната GPA
Салли Уиттакер 2018 Дом Маккаррена 312 3,75
Белинда Джеймсон 2017 Кушинг Хаус 148 3,52
Джефф Смит 2018 Прескотт Хаус 17-D 3.20
Сэнди Аллен 2019 Оливер Хаус 108 3,48

Приведенные выше данные могут быть представлены в файле в формате CSV следующим образом:

 Салли Уиттакер, 2018, Дом Маккаррена, 312,3.75 Белинда Джеймсон, 2017, Кушинг Хаус, 148,3.52 Джефф Смит, 2018, Прескотт Хаус, 17-Д, 3.20 Сэнди Аллен, 2019, Оливер Хаус, 108,3.48 

Здесь поля данных в каждой строке разделяются запятой, а отдельные строки разделяются новой строкой.

CSV - это текстовый файл, поэтому его можно создавать и редактировать с помощью любого текстового редактора. Однако чаще файл CSV создается путем экспорта ( File > Export ) электронной таблицы или базы данных в программе, которая их создала. Щелкните ссылку ниже, чтобы узнать, как создать файл CSV в Блокноте, Microsoft Excel, OpenOffice Calc и Google Docs.

Блокнот (или любой текстовый редактор)

Чтобы создать файл CSV с помощью текстового редактора, сначала выберите свой любимый текстовый редактор, например Блокнот или vim, и откройте новый файл.Затем введите текстовые данные, которые должен содержать файл, разделяя каждое значение запятой и каждую строку новой строкой.

 Заголовок1, Заголовок2, Заголовок3 один два три пример1, пример2, пример3 

Сохраните этот файл с расширением .csv . Затем вы можете открыть файл с помощью Microsoft Excel или другой программы для работы с электронными таблицами. Это создаст таблицу данных, подобную следующей:

Название1 Название2 Название3
один два три
пример1 пример2 пример3

В созданном вами файле CSV отдельные поля данных были разделены запятыми.Но что, если в самих данных есть запятые?

Если поля данных в файле CSV содержат запятые, вы можете защитить их, заключив эти поля данных в двойные кавычки ( "). Запятые, которые являются частью ваших данных, хранятся отдельно от запятых, разделяющих сами поля.

Например, предположим, что одно из наших текстовых полей - это созданное пользователем описание, которое позволяет использовать запятые в описании. Если бы наши данные выглядели так:

Свинец Название Телефон Банкноты
Джим Грейсон Старший менеджер (555) 761-2385 Выступил во вторник, он заинтересован
Прецилла Уинстон Директор по развитию (555) 218-3981 сказал перезвонить на следующей неделе
Мелисса Поттер Заведующий бухгалтерией (555)791-3471 Не интересовало, дал направление

Чтобы сохранить запятые в столбце «Примечания», мы можем заключить эти поля в кавычки.Например:

 Свинец, Должность, Телефон, Примечания Джим Грейсон, старший менеджер, (555) 761-2385, «Во вторник говорил, ему интересно» Пресилла Уинстон, директор по развитию, (555) 218-3981, сказала, что позвонит еще раз на следующей неделе. Мелисса Поттер, руководитель отдела счетов, (555) 791-3471, «Не интересно, дала направление» 

Как видите, в кавычки заключены только поля, содержащие запятые.

То же самое касается новых строк, которые могут быть частью ваших данных поля. Любые поля, содержащие новую строку как часть данных, должны быть заключены в двойные кавычки.

Если ваши поля содержат двойные кавычки как часть своих данных, внутренние кавычки необходимо удвоить, чтобы их можно было правильно интерпретировать. Например, при следующих данных:

Игрок Позиция Никнеймы лет активности
Скиппи Петерсон Первая база «Голубая собака», «Волшебник» 1908-1913
Бад Гримсби Центральное поле «Жнец», «Длинная шея» 1910-1917
Вик Крамб Перемычка «Фэт Вик», «Ледяная горячка» 1911-1912

Мы можем представить это в файле CSV следующим образом:

 Имя игрока, должность, псевдонимы, годы активности Скиппи Петерсон, «Первая база», «Синяя собака», «Волшебник» «», 1908-1913 гг. Бад Гримсби, Center Field, "" "Жнец" "," "Длинная шея" "", 1910-1917 гг. Вик Крамб, Шортстоп, "" "Толстый Вик" "," "Ледяной жар" "", 1911-1912 гг. 

Здесь все поле данных заключено в кавычки, а внутренние кавычки предваряются (экранируются) дополнительной двойной кавычкой.

Вот правила форматирования данных в файле CSV из документа IETF, RFC 4180. В этих примерах « CRLF » используется для представления возврата каретки и перевода строки (которые вместе составляют новую строку) .

  1. Каждая запись (строка данных) должна быть на отдельной строке, разделенной разрывом строки. Например:
     aaa, bbb, ccc CRLF 
  2. Последняя запись в файле может иметь или не иметь конечный разрыв строки. Например:
     aaa, bbb, ccc CRLF zzz, yyy, xxx 
  3. Может быть дополнительная строка заголовка, появляющаяся как первая строка файла с тем же форматом, что и обычные строки записи.Заголовок содержит имена, соответствующие полям в файле. Кроме того, он должен содержать такое же количество полей, что и записи в остальной части файла. Например:
     имя_поля, имя_поля, имя_поля CRLF aaa, bbb, ccc CRLF zzz, yyy, xxx CRLF 
  4. В заголовке и каждой записи может быть одно или несколько полей, разделенных запятыми. Каждая строка должна содержать одинаковое количество полей во всем файле. Пробелы считаются частью поля и не должны игнорироваться. Последнее поле в записи не должно начинаться с запятой.Например:
     aaa, bbb, ccc 
  5. Каждое поле может быть заключено или не заключено в двойные кавычки. Если поля не заключены в двойные кавычки, двойные кавычки могут не отображаться внутри полей. Например:
     «aaa», «bbb», «ccc» CRLF zzz, yyy, xxx 
  6. Поля, содержащие разрывы строк (CRLF), двойные кавычки и запятые, должны быть заключены в двойные кавычки. Например:
     «aaa», «b CRLF bb», «ccc» CRLF zzz, yyy, xxx 
  7. Если поля заключаются в двойные кавычки, то двойные кавычки внутри поля должны быть экранированы, поставив перед ними другую двойную кавычку.Например:
     «aaa», «b» «bb», «ccc» 

Microsoft Excel

Чтобы создать файл CSV с помощью Microsoft Excel, запустите Excel, а затем откройте файл, который вы хотите сохранить, в формате CSV . Например, ниже приведены данные, содержащиеся в нашем примере листа Excel:

Арт. Стоимость продано Прибыль
Клавиатура $ 10,00 $ 16.00 $ 6.00
Монитор 80 долларов.00 120,00 $ 40,00
Мышь $ 5.00 $ 7.00 $ 2,00
Всего 48,00 $

После открытия щелкните Файл и выберите Сохранить как . В разделе Сохранить как тип выберите CSV (с разделителями-запятыми) или CSV (с разделителями-запятыми) (* .csv) , в зависимости от вашей версии Microsoft Excel.

После сохранения файла вы можете открыть его в текстовом редакторе, чтобы просмотреть или отредактировать вручную. Его содержимое выглядит следующим образом:

 Предмет, Стоимость, Продано, Прибыль Клавиатура, 10, 16, 6 долларов Монитор, 80, 120, 40 долларов Мышь, 5 долларов США, 7 долларов США, 2 доллара США. ,, Итого, $ 48,00 
Запись

Последняя строка начинается с двух запятых, потому что первые два поля этой строки в нашей электронной таблице были пустыми. Не удаляйте их - две запятые необходимы, чтобы поля соответствовали от строки к строке.Их нельзя пропустить.

OpenOffice Calc

Чтобы создать файл CSV с помощью OpenOffice Calc, запустите Calc и откройте файл, который вы хотите сохранить как файл CSV. Например, ниже приведены данные, содержащиеся в нашем примере рабочего листа Calc.

Арт. Стоимость продано Прибыль
Клавиатура $ 10,00 $ 16.00 $ 6.00
Монитор 80,00 $ 120 долларов.00 40,00
Мышь $ 5.00 $ 7.00 $ 2,00
Всего 48,00 $

После открытия щелкните Файл , выберите параметр Сохранить как , а для параметра Сохранить как тип выберите Текстовый CSV (.csv) (* .csv) .

Если бы вы открыли CSV-файл в текстовом редакторе, например, в Блокноте, это было бы похоже на пример ниже.

 Предмет, Стоимость, Продано, Прибыль Клавиатура, 10, 16, 6 долларов Монитор, 80, 120, 40 долларов Мышь, 5 долларов США, 7 долларов США, 2 доллара США. ,, Итого, $ 48,00 

Как и в нашем примере Excel, две запятые в начале последней строки обеспечивают соответствие полей от строки к строке. Не снимайте их!

Документы Google

Откройте Документы Google и откройте файл электронной таблицы, который хотите сохранить как файл CSV. Щелкните File , Download as , а затем выберите CSV (текущий лист) .

.

Создайте файл CSV с помощью PHP и сохраните его в каталоге

Переполнение стека
  1. Около
  2. Продукты
  3. Для команд
  1. Переполнение стека Общественные вопросы и ответы
  2. Переполнение стека для команд Где разработчики и технологи делятся частными знаниями с коллегами
.

python 3.x - Как выполнить функцию и сохранить в новом CSV-файле?

Переполнение стека
  1. Около
  2. Продукты
  3. Для команд
  1. Переполнение стека Общественные вопросы и ответы
  2. Переполнение стека для команд
.

c ++ - Как сохранить изображение OpenCV 3.2 в файл csv, а затем загрузить его для отображения?

Переполнение стека
  1. Около
  2. Продукты
  3. Для команд
  1. Переполнение стека Общественные вопросы и ответы
  2. Переполнение стека для команд Где разработчики и технологи
.

Смотрите также