Csv как разделить по столбцам
Перейти к содержимому

Csv как разделить по столбцам

  • автор:

Создание и изменение CSV-файлов для импорта в Outlook

CSV-файлы (файлы данных с разделителями-запятыми) — это файлы особого типа, которые можно создавать и редактировать в Excel. В CSV-файлах данные хранятся не в столбцах, а разделенные запятыми. Текст и числа, сохраненные в CSV-файле, можно легко переносить из одной программы в другую. Например, вы можете экспортировать контакты из Google в CSV-файл, а затем импортировать их в Outlook.

Сведения о том, как импортировать список записей календаря в Outlook, см. в статье Импорт и экспорт электронной почты, контактов и календаря Outlook.

Создание CSV-файла из другой программы или службы электронной почты другого поставщика

При экспорте контактов из другой программы, например Gmail, обычно можно выбрать один из нескольких форматов. В Gmail на выбор предлагаются CSV-файл Google, CSV-файл Outlook и файлы vCard. При экспорте данных из профиля Outlook для последующего импорта в другой профиль можно выбрать CSV-файл или файл данных Outlook (PST).

Скачивание и открытие образца CSV-файла для импорта контактов в Outlook

Вы можете создать CSV-файл вручную одним из двух способов.

Создание файла Excel и его сохранение в формате CSV

Если сведения о контактах хранятся в программе, из которой их невозможно экспортировать, вы можете ввести их вручную.

  1. Создайте новый документ в Excel.
  2. Добавьте заголовок столбца для каждого фрагмента сведений, который вы хотите записать (например, для имени, фамилии, адреса электронной почты, номера телефона и дня рождения), а затем введите данные в соответствующие столбцы.
  3. Когда вы закончите, файл Excel должен выглядеть примерно так:

Образец CSV-файла, открытый в Excel

Сохраните файл Excel в формате CSV.

Скачивание шаблона CSV-файла

Если вы хотите начать с пустого CSV-файла, то можете скачать образец ниже.

После скачивания образца CSV-файла сохраните его на своем компьютере с типом CSV.

    Скачайте этот образец CSV-файла на свой компьютер. При появлении запроса нажмите кнопку Сохранить и сохраните файл на своем компьютере в формате CSV. Если сохранить файл в формате Excel (XLS или XLSM) все данные будет добавлены в один столбец.

Чтобы найти CSV-файл, выберите

  • Откройте Excel на компьютере.
  • В Excel выберите Файл >Открыть и перейдите к CSV-файлу, скачанному на компьютер. Чтобы найти CSV-файл, выберите Все файлы. Щелкните CSV-файл, чтобы открыть его.

    При работе с этим CSV-файлом нужно помнить о нескольких вещах.

    Образец CSV-файла, открытый в Excel

      Для Outlook необходимо, чтобы в первой строке находились заголовки столбцов, поэтому не заменяйте их другими данными.
      Язык заголовков столбцов должен совпадать с языком Outlook, используемым по умолчанию. Например, если в качестве языка Outlook по умолчанию настроен португальский, требуется изменить заголовки столбцов, чтобы они отображались на португальском языке.

    После импорта контактов они выглядят в Outlook в Интернете примерно так.

  • Вы можете удалить данные из строк 2–6 (например, имена, телефонные номера, адреса электронной почты и т. д).
  • Вводить данные во всех столбцах необязательно. Укажите только необходимые сведения.
  • Сохраните файл в формате CSV под другим именем. Если вы работаете с этим файлом в Excel, то при его сохранении получите несколько запросов такого типа: «Вы действительно хотите сохранить файл в формате CSV?» Всегда выбирайте ответ «Да». Если вы выберете «Нет», файл будет сохранен в собственном формате Excel (XLSX) и его нельзя будет использовать для импорта данных в Outlook.
  • Попробуйте импортировать CSV-файл с несколькими контактами, чтобы убедиться в получении правильных результатов. После этого можно удалить импортированные контакты, добавить все нужные контакты в CSV-файл и снова импортировать его. Если вы импортируете данные из образца CSV-файла, вот как это будет выглядеть в Outlook в Интернете для Microsoft 365:

    Изменение CSV-файла с контактами, которые нужно импортировать в Outlook

    Предположим, вы хотите изменить CSV-файл, экспортированный из Outlook, а затем снова импортировать его в это приложение или другую почтовую службу. Вы можете легко сделать это с помощью Excel.

    При изменении CSV-файла учитывайте перечисленные ниже моменты.

    • Заголовки столбцов должны оставаться в первой строке.
    • При сохранении файла в Excel несколько раз появятся запросы такого типа: «Вы действительно хотите сохранить файл в формате CSV?» Всегда выбирайте ответ «Да». Если вы выберете «Нет», файл будет сохранен в собственном формате Excel (XLSX) и его нельзя будет использовать для импорта в Outlook.

    Проблема: все данные выводятся в первом столбце

    Пример CSV-файла, сохраненного в формате XLS.

    Это могло произойти по нескольким причинам, поэтому можно попробовать несколько решений.

    • Если вы сохраните CSV-файл в другом формате, например XLS, XLSX или XLM, все данные будут отображаться в первом столбце. Вернитесь к исходному CSV-файлу и сохраните его в формате CSV.
    • Возможно, программа, в которой был создан CSV-файл, добавляет к данным дополнительные кавычки, из-за чего Excel считает их одной строкой. Предположим, например, что у вас такие данные: a, b, c, d — Excel поместит каждую букву в отдельный столбец. «a, b, c, d», e — Excel поместит a, b, c, d в один столбец, а e — в другой. Чтобы проверить, не в этом ли проблема, откройте файл в Блокноте: Щелкните CSV-файл правой кнопкой мыши, выберите Открыть с помощью >Блокнот. Выполните поиск дополнительных кавычек. Если они есть, вот как можно исправить файл:
    • Откройте CSV-файл в Excel. Все данные будут добавлены в столбец A без кавычек.
    • С помощью мастера распределения текста по столбцам разделите данные столбца A на отдельные столбцы: в строке меню выберите Данные >Текст по столбцам.

    Разделение текста на столбцы с помощью мастера распределения текста по столбцам

    С помощью мастера распределения текста по столбцам текст, содержащийся в одной ячейке, можно разделить на несколько.

    Браузер не поддерживает видео. Установите Microsoft Silverlight, Adobe Flash Player или Internet Explorer 9.

    Проверьте, как это работает!

    1. Выделите ячейку или столбец с текстом, который вы хотите разделить.
    2. На вкладке Данные нажмите кнопку Текст по столбцам.
    3. В мастере распределения текста по столбцам установите переключатель с разделителями и нажмите кнопку Далее.
    4. Выберите разделители для своих данных. Например, запятую и пробел. Данные можно предварительно просмотреть в окне Образец разбора данных.
    5. Нажмите кнопку Далее.
    6. В поле Поместить в выберите место на листе, где должны отображаться разделенные данные.
    7. Нажмите кнопку Готово.

    Разбить CSV строку датафрейма по запятой и расположить в столбец

    В общем задача такая, имеется датафрейм, содержащий данные вида:

    Id Sequence 3 1,3,13. 7 1,2,1. 8 1,2,4. 11 1,8,25. 13 1,111. 

    Где id — номер последовательности, sequence — сама последовательность. Задача, взять например первую последовательность и расположить его в столбец и так со всеми. Количество элементов в последовательности везде разное. Я делаю так:

    #Импортируем необходимые пакеты import sys import warnings import pandas as pd import numpy as np from sklearn.metrics import mean_absolute_error, mean_squared_error import statsmodels.formula.api as smf import statsmodels.tsa.api as smt import statsmodels.api as sm import scipy.stats as scs from scipy.optimize import minimize import matplotlib.pyplot as plt #читаем данные и выводим dftrain = pd.read_csv('../../data/IntegerSeqTrain.csv', sep=",", index_col=['Id']) dftrain.head(10) 

    Выдаст: (то, что sequence выше id меня уже смущает)

     Sequence Id 3 1,3,13. 7 1,2,1. 8 1,2,4. 11 1,8,25. 13 1,111. 

    Далее, собственно само разбиение

    #для удобства пишем последовательности в столбец, предварительно разбив по запятой print(dftrain.shape[1]) i=0 for dfitem in dftrain: j=0 for dfitem2 in dfitem: dftrain[j] = dftrain['Sequence'].str.split(',').str.get(j) j+=1 i+=1 #удаляем лишний столбец dftrain = dftrain.drop('Sequence', 1) #pd.set_option('max_colwidth', 10) #что получилось print(dftrain.head(10)) 
     0 1 2 3 4 5 6 7 Id 3 1 3 13 87 1053 28576 2141733 508147108 7 1 2 1 5 5 1 11 16 8 1 2 4 5 8 10 16 20 11 1 8 25 83 274 2275 132224 1060067 13 1 111 12211 1343211 147753211 162528. 178781. 196659. 15 1 1 1 1 1 1 1 1 16 840 1320 1680 2520 3192 3432 4920 5208 
    1. Все записалось в строку, а не в столбец
    2. Количество столбцов сильно сократилось (штук 8-9, хотя их на самом деле гораздо больше)

    Как данные красиво разбить и представить в виде столбцов?) Спасибо заранее Сами данные(train.csv): https://dropmefiles.com/osxrI

    Отслеживать

    149k 12 12 золотых знаков 59 59 серебряных знаков 133 133 бронзовых знака

    задан 16 дек 2018 в 23:15

    359 1 1 серебряный знак 12 12 бронзовых знаков

    1 ответ 1

    Сортировка: Сброс на вариант по умолчанию

    train = pd.read_csv(r'C:\download\train.csv', sep=",", index_col=['Id']) r = train.Sequence.str.split(',', expand=True).T 
    In [203]: r Out[203]: Id 3 7 8 11 13 15 16 . 227681 227682 227683 227684 227686 227689 227690 0 1 1 1 1 1 1 840 . 7 1 0 0 0 2 5 1 3 2 2 8 111 1 1320 . 7 0 0 -1 1 3 7 2 13 1 4 25 12211 1 1680 . 3 1 4 -1 9 3 179 3 87 5 5 83 1343211 1 2520 . 2 0 1198 -1 85 4 229 4 1053 5 8 274 147753211 1 3192 . 3 0 1829388 -1 801 6 439 5 28576 1 10 2275 16252853211 1 3432 . 9 0 23796035743 10324303 7549 4 557 6 2141733 11 16 132224 1787813853211 1 4920 . 5 0 2142967506078650 -6586524273069171148 71145 5 6113 .. . . . . . . . . . . . . . . . 341 None None None None None None None . None None None None None None None 342 None None None None None None None . None None None None None None None 343 None None None None None None None . None None None None None None None 344 None None None None None None None . None None None None None None None 345 None None None None None None None . None None None None None None None 346 None None None None None None None . None None None None None None None 347 None None None None None None None . None None None None None None None [348 rows x 113845 columns] In [204]: r.columns Out[204]: Int64Index([ 3, 7, 8, 11, 13, 15, 16, 18, 20, 21, . 227677, 227679, 227680, 227681, 227682, 227683, 227684, 227686, 227689, 227690], dtype='int64', name='Id', length=113845) In [205]: r.shape Out[205]: (348, 113845) 

    Как разбить по столбцам csv файл на языке Python?

    150000,2016-01-01,Chris Riley,trailhead9.ub20k5i9t8ou@example.com
    150000,2016-01-01,Harold Campbell,trailhead14.jibpbwvuy67t@example.com
    150000,2016-01-01,Jessica Nichols,trailhead19.d1fxj2goytkp@example.com
    150000,2016-01-01,Catherine Brown,trailhead16.kojyepokybge@example.com
    150000,2016-01-01,Kelly Frazier,trailhead7.zdcsy4ax10mr@example.com
    150000,2016-01-01,Dennis Howard,trailhead4.wfokpckfroxp@example.com

    Выбираем, например, 3 и 4 столбец .После работы программы должно получиться два файла. В одном списком все данные из 3 столбца, в другом списком все данные из 4 столбца.

    Файл 1
    Chris Riley
    Harold Campbell
    Jessica Nichols
    Catherine Brown
    Kelly Frazier
    Dennis Howard
    Файл 2

    trailhead9.ub20k5i9t8ou@example.com
    trailhead14.jibpbwvuy67t@example.com
    trailhead19.d1fxj2goytkp@example.com
    trailhead16.kojyepokybge@example.com
    trailhead7.zdcsy4ax10mr@example.com
    trailhead4.wfokpckfroxp@example.com

    • Вопрос задан более двух лет назад
    • 3237 просмотров
  • Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *