Как выбрать разделитель в csv

Как заставить Excel интерпретировать запятую как разделитель по умолчанию в файлах CSV?

csv Расширение получает связано с Excel при установке Excel. Однако, если я открою один из этих файлов с помощью Excel, все будет помещено в один и тот же столбец, и запятая не будет интерпретироваться как разделитель.

Есть ли способ заставить Excel автоматически интерпретировать разделитель и показывать CSV-файл как правильную таблицу, как только он открывается? Мне нужно это, чтобы я мог использовать Excel для быстрого просмотра таких файлов.

Я подозреваю, что должен быть способ, иначе Excel не связался бы с файлами CSV.

При открытии CSV-файлов Excel будет использовать системный региональный параметр, вызываемый List separator для определения используемого по умолчанию разделителя.

В Windows вы можете изменить List separator настройки в соответствии Regional and Language Options с указаниями на веб-сайте поддержки Office :

Изменить разделитель в текстовом файле CSV

Примечание : это работает только в том случае, если десятичный символ также не обозначен как запятая (в соответствии с приведенной выше цитатой из Википедии). Если это так, Excel не будет использовать запятую в качестве разделителя списка, даже если он выбран. Для многих регионов за пределами США запятая является десятичным символом по умолчанию.

В Mac OS X этот параметр, по-видимому, выводится из параметра десятичного разделителя (на панели « Язык и регион» в Системных настройках перейдите к разделу «Дополнительно» ). Если десятичный разделитель является точкой, то разделитель CSV по умолчанию будет запятой, но если разделитель десятичных чисел является запятой, то разделитель CSV по умолчанию будет точкой с запятой.

Источник

Как выбрать разделитель в csv

Добрый день! Уважаемые читатели и гости одного из крупнейших IT блогов для системных администраторов Pyatilistnik.org. В прошлый раз мы с вами подробно разобрали 10 методов как открыть командную строку. В сегодняшней публикации я хочу вас научить разбивать строки в CSV файле на столбцы, которые потом можно использовать в файлах Excel. Уверен, что многие системные администраторы часто работаю с экспортными данными в формате CSV.

Постановка задачи

Бьюсь об заклад, что у 99% средних и крупных организаций в России инфраструктура построена на использовании Active Directory. Активный каталог замечательная вещь и легко интегрируется в различные сторонние сервисы. Самая частая задача администратора, это получение отчетов или выгрузок по определенным критериям, например:

Получить данные вы можете в разном виде, например в виде выдачи на самом экране, или же в сохраненный файл в формате txt или csv. CSV более распространенный, так как позволяет не только выгружать данные, но и еще их импортировать. Вроде бы все удобно, но есть одно но, когда вы захотите красиво перенести такие данные из csv, txt или экрана, у вас не будет форматирования или столбцов, все будет смешано в кучу, а это не удобно. Ниже я вас научу это обходить.

Структура файла CSV

Файл с разделителями-запятыми (CSV) представляет собой простой текстовый файл, который содержит список данных. Эти файлы часто используются для обмена данными между различными приложениями. Например, базы данных и менеджеры контактов часто поддерживают файлы CSV.

Эти файлы иногда могут называться символьно-разделенными значениями или файлами с разделителями-запятыми. В основном они используют запятую для разделения данных, но иногда используют другие символы, такие как точки с запятой. Идея состоит в том, что вы можете экспортировать сложные данные из одного приложения в файл CSV, а затем импортировать данные из этого файла CSV в другое приложение.

Вот пример такого строки с разделителями:

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

теперь представьте, что таких строк сотни или тысячи, а вы хотите все скопировать в ваш Exсel и по столбцам, вот тут вы и поймете, что одностроковый формат требует преобразования. Благо, это делается очень быстро и просто. Вот пример моего тестового csv файла.

Как csv разделить по столбцам в Excel

Первым инструментом, который позволит из csv получить красивые столбцы и разбиение по ним, будет Excel. Откройте в Excel ваш файл csv.

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

На первом окне мастера распределения текста по столбцам нажмите «Далее».

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

Далее вам необходимо указать по каким критериям производить разбивку по столбцам, на выбор у вас будет:

В моем примере CSV разделяет отдельные данные с помощью запятой. Тут же вы сразу видите, как это будет выглядеть в области «Образец разбора данных«.

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

Далее при необходимости вы можете указать формат (Общий, текстовый, дата) и диапазон к которому будет применяться ваше преобразование. Нажимаем «Готово«.

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

На выходе я получил красивую таблицу, где есть разбивка по столбца. В таком виде мне уже удобнее оперировать данными.

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

Далее вам остается сохранить файл в формате xlsx и радуемся жизни.

Как csv разделить по столбцам через Google Таблицы

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

Начнется переделывание формата CSV в формат Google Таблиц

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

На выходе вы получаете разделенный по столбцам документ.

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

Выбираете тип разделения, в моем случае запятая.

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

В результате чего они будут разбиты на аккуратные столбцы

Источник

Как создать CSV файл через таблицу Excel

Возможность создания CSV файла из таблицы Excel позволяет преобразовывать документы в нужный формат для загрузки в любые системы, например, outlook, Google Analytics, Яндекс.Метрику и многое другое.

Простой способ создания CSV через таблицу в Excel

В качестве примера будет использоваться таблица с данными, которую можно будет скачать ниже.

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

Для превращения файла в CSV потребуется нажать на кнопку «Файл» (левый-верхний угол).

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

Далее выбираем пункт «Сохранить как» и нажимаем на «Обзор».

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

Теперь выбираем нужный формат, например, стандартный CSV.

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

Все готово, мы получили нужный формат.

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

Проверив его в блокноте можно увидеть, что разделители стоят «;» (точка с запятой).

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

Ручной метод превращения таблицы Эксель в CSV-файл

Если требуется создать кастомный файл (с собственными разделителями, например, |). Для этого прописываем конструкцию между каждым элементом:

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

Далее таким образом соединяем все элементы.

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

Растягиваем формулу до конца документа.

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

Выделяем нужный столбец (новый) и правым кликом мыши по нему выводим меню, где нажимаем на «Копировать».

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

Создаем текстовый документ новый (блокнот), кликнув правой клавишей мыши в нужной папке.

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

Открываем его и вводим новое поле.

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

После в левом-верхнем углу кликаем на «Файл»-«Сохранить как».

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

Выбираем нужный тип кодировки и сохраняем документ.

Важно! Лучше всего выбирать UTF-8, что позволит работать в дальнейшем с кириллицей.

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

Теперь опять кликаем правой клавишей мыши на файл и нажимаем на «Переименовать».

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

Стираем разрешение «.txt» и прописываем вместо него «.csv». При необходимости меняем название.

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

Все готово, мы получили нужный формат.

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

Для чего это нужно?

Создание CSV-файла потребуется для:

Также можно ознакомиться с инструкцией по открытию CSV файла.

Источник

Data.gov.ru

открытые данные России

Вы здесь

Ваше мнение очень важно при доработке и совершенствовании «Портала открытых данных РФ»

Данный вопрос является особо актуальным в контексте связывания и постобработки информации наборов открытых данных.

Для начала посмотрим на формулировку из Википедии https://ru.wikipedia.org/wiki/CSV

«Значения отдельных колонок разделяются разделительным символом (delimiter) — запятой (,). Однако, большинство программ вольно трактует стандарт CSV и допускают использование иных символов в качестве разделителя. В частности в локалях, где десятичным разделителем является запятая, в качестве табличного разделителя, как правило, используется точка с запятой.»

В тексте Методических рекомендаций версии 3.0 (стр. 55) говорится об использовании запятой в качестве разделителя.

На практике дело обстоит несколько иначе. Все дело (чаще всего) сводится к неразберихе со значениями поля Адрес. Во многих существующих информационных системах значения данного поля отсутствуют, либо их содержимое не стандартизовано. Кроме того, каждая информационная система имеет свои правила и ограничения.

Одним из наиболее корректных выходов в данной ситуации видится выделение под каждую часть адреса своего отдельного столбца, то есть разделителем в файле остается «,», но увеличивается количество столбцов.

«Начнем с того, что форматом CSV на самом деле называют три разных текстовых формата, отличающихся символами-разделителями: собственно сам CSV (comma-separated values — значения, разделенные запятыми), TSV (tab-separated values — значения, разделенные табуляциями) и SCSV (semicolon separated values — значения, разделенные точкой с запятой). В жизни все три могут называться одним CSV, символ-разделитель в лучшем случае выбирается при экспорте или импорте, а чаще его просто «зашивают» внутрь кода. Это создает массу проблем в попытке разобраться»

Главным минусом использования «;», является невозможность использования наборов с этим разделителем на иностранных порталах. А для развития ОД в России и интеграции с иностранными порталами это сможет стать большой проблемой.

Меня всегда умиляют проблемы «интеграции с иностранными порталами».
Обеспечить единство правил работы внутри своей страны мы не можем/не пытаемся,
обеспечить однозначность записи/чтения информации из CSV (SCSV) форматов мы не требуем.

Хотя, что нам мешает СДЕЛАТЬ это, не понятно.

Основной задачей публикаторов ОД стала бы понятная им задача формирования таблиц в Excel с соблюдением НЕКОТОРЫХ понятных ограничений.

Ну и ещё два весёлых предложеньица:
1)почему бы не организовать на DATA.GOV.RU АБСОЛЮТНО корректную и одинаковую для всех онлайн-конвертацию таблиц XLS-CSV-XLS?
(с контролем соблюдения правил подготовки исходных данных, с указанием на ошибки и возможные разночтения полей. )
2)почему бы не организовать на DATA.GOV.RU АБСОЛЮТНО корректную и одинаковую для всех онлайн-конвертацию таблиц XLS-HTML?

А как будут «иносранцы» обрабатывать наши сведения меня волнует меньше всего.

Источник

Язвы и грабли CSV и Excel: проблемы и решения

CSV является стандартом де-факто для связи между собой разнородных систем, для передачи и обработки объемных данных с «жесткой», табличной структурой. Во многих скриптовых языках программирования есть встроенные средства разбора и генерации, он хорошо понятен как программистам, так и рядовым пользователям, а проблемы с самими данными в нем хорошо обнаруживаются, как говорится, на глаз.

История этого формата насчитывает не менее 30 лет. Но даже сейчас, в эпоху повального использования XML, для выгрузки и загрузки больших объемов данных по-прежнему используют CSV. И, несмотря на то, что сам формат довольно неплохо описан в RFC, каждый его понимает по-своему.

Начнем с того, что форматом CSV на самом деле называют три разных текстовых формата, отличающихся символами-разделителями: собственно сам CSV (comma-separated values — значения, разделенные запятыми), TSV (tab-separated values — значения, разделенные табуляциями) и SCSV (semicolon separated values — значения, разделенные точкой с запятой). В жизни все три могут называться одним CSV, символ-разделитель в лучшем случае выбирается при экспорте или импорте, а чаще его просто «зашивают» внутрь кода. Это создает массу проблем в попытке разобраться.

Как иллюстрацию возьмем казалось бы тривиальную задачу: импортировать в Microsoft Outlook данные из таблицы в Microsoft Excel.

В Microsoft Excel есть средства экспорта в CSV, а в Microsoft Outlook — соответствующие средства импорта. Что могло быть проще — сделал файлик, «скормил» почтовой программе и — дело сделано? Как бы не так.

Создадим в Excel тестовую табличку:

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

… и попробуем экспортировать ее в три текстовых формата:

«Текст Unicode»Кодировка — UTF-16, разделители — табуляция, переводы строк — 0×0D, 0×0A, объем файла — 222 байт
«CSV (разделители — запятые)»Кодировка — Windows-1251, разделители — точка с запятой (не запятая!), во второй строке значение телефонов не взято в кавычки, несмотря на запятую, зато взято в кавычки значение «01;02», что правильно. Переводы строк — 0×0D, 0×0A. Объем файла — 110 байт
«Текстовые файлы (с разделителями табуляции)»Кодировка — Windows-1251, разделители — табуляция, переводы строк — 0×0D, 0×0A. Значение «01;02» помещено в кавычки (без особой нужды). Объем файла — 110 байт

Какой вывод мы делаем из этого. То, что здесь Microsoft называет «CSV (разделители — запятые)», на самом деле является форматом с разделителями «точка с запятой». Формат у Microsoft — строго Windows-1251. Поэтому, если у вас в Excel есть Unicode-символы, они на выходе в CSV отобразятся в вопросительные знаки. Также то, что переводами строк является всегда пара символов, то, что Microsoft тупо берет в кавычки все, где видит точку с запятой. Также то, что если у вас нет Unicode-символов вообще, то можно сэкономить на объеме файла. Также то, что Unicode поддерживается только UTF-16, а не UTF-8, что было бы сильно логичнее.

«Значения, разделенные табуляцией(Windows)»Скармливаем аутлуку файл tsv, с разделенными табуляцией значениями и. — чтобы вы думали. Outlook склеивает поля и табуляцию не замечает. Заменяем в файле табуляцию на запятые и, как видим, поля уже разбирает, молодец.
«Значения, разделенные запятыми (Windows)»А вот аутлук как раз понимает все верно. Comma — это запятая. Поэтому ожидает в качестве разделителя запятую. А у нас после экселя — точка с запятой. В итоге аутлук распознает все неверно.

Два майкрософтовских продукта не понимают друг друга, у них напрочь отсутствует возможность передать через текстовый файл структурированные данные. Для того, чтобы все заработало, требуются «пляски с бубном» программиста.

Мы помним, что Microsoft Excel умеет работать с текстовыми файлами, импортировать данные из CSV, но в версии 2007 он делает это очень странно. Например, если просто открыть файл через меню, то он откроется без какого-либо распознавания формата, просто как текстовый файл, целиком помещенный в первую колонку. В случае, если сделать дабл-клик на CSV, Excel получает другую команду и импортирует CSV как надо, не задавая лишних вопросов. Третий вариант — вставка файла на текущий лист. В этом интерфейсе можно настраивать разделители, сразу же смотреть, что получилось. Но одно но: работает это плохо. Например, Excel при этом не понимает закавыченных переводов строк внутри полей.

Более того, одна и та же функция сохранения в CSV, вызванная через интерфейс и через макрос, работает по-разному. Вариант с макросом не смотрит в региональные настройки вообще.

Стандарта CSV как такового, к сожалению, нет, но, между тем, существует т.н. memo. Это RFC 4180 года, в котором описано все довольно толково. За неимением ничего большего, правильно придерживаться хотя бы RFC. Но для совместимости с Excel следует учесть его собенности.

Вот краткая выжимка рекомендаций RFC 4180 и мои комментарии в квадратных скобках:

Вот в нотации ABNF описание формата:

Также при реализации формата нужно помнить, что поскольку здесь нет указателей на число и тип колонок, поскольку нет требования обязательно размещать заголовок, здесь есть условности, о которых необходимо не забывать:

Пример валидного CSV, который можно использовать для тестов:

точно такой же SCSV:

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

Второй файлик, который по логике SCSV, экселом воспринимается и выходит вот что:

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

С приведением типов сработало, но зато теперь не обрабатываются нормально переводы строк и осталась проблема с ведущими нулями, кавычками и лишними пробелами. Да и пользователям так открывать CSV крайне неудобно.

Есть эффективный способ, как заставить Excel не приводить типы, когда это нам не нужно. Но это будет CSV «специально для Excel». Делается это помещением знака «=» перед кавычками везде, где потенциально может возникнуть проблема с типами. Заодно убираем лишние пробелы.

И вот что случаеся, если мы открываем этот файлик в экселе:

Как выбрать разделитель в csv. Смотреть фото Как выбрать разделитель в csv. Смотреть картинку Как выбрать разделитель в csv. Картинка про Как выбрать разделитель в csv. Фото Как выбрать разделитель в csv

Чтобы построить хороший и удобный импортер CSV, необходимо помнить о следующем:

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *