logo

R 프로그래밍에서 CSV 파일의 내용 읽기 - read.csv() 함수

읽기.csv() R 언어의 함수는 쉼표로 구분된 값 파일을 읽는 데 사용됩니다. 형식으로 데이터를 가져옵니다. 데이터 프레임.

통사론: read.csv(파일, 헤더, sep, dec) 매개변수: 파일: R로 가져올 데이터가 포함된 파일의 경로입니다. 머리글: 논리적 가치. TRUE인 경우 read.csv()는 파일에 헤더 행이 있다고 가정하므로 행 1은 각 열의 이름입니다. 그렇지 않은 경우 헤더 = FALSE 인수를 추가할 수 있습니다. 9월: 필드 구분 문자 12월: 파일에서 소수점으로 사용되는 문자입니다.



data 변수는 read.csv() 함수를 사용한 후 CSV 파일의 내용을 보유하지만 다른 변수를 자유롭게 사용할 수 있습니다.

read.csv() 함수는 가져오기 절차를 수정하는 데 사용할 수 있는 여러 선택적 인수도 허용합니다. 첫 번째 행을 열 이름으로 처리하고 구분 기호 문자를 선택하는 등의 작업을 선택할 수 있습니다. 이러한 옵션에 대한 추가 정보는 read.csv() 설명서를 참조하세요.

read.csv() 메서드에 올바른 파일 경로 또는 URL을 제공하여 파일이 올바른 구분 기호와 따옴표를 포함하는 올바른 CSV 형식인지 확인하세요.



예시 1: 동일한 폴더에서 파일 읽기

아르 자형






# R program to read a csv file> # Get content into a data frame> data <->read.csv>(>'CSVFileExample.csv'>,> >header =>FALSE>, sep =>' '>)> > # Printing content of Text File> print>(data)>

>

>

산출:

 V1 V2 V3 1 100 AB ab 2 200 CD cd 3 300 EF ef 4 400 GH gh 5 500 IJ ij>

예제 2: 다른 디렉터리에서 파일 읽기

아르 자형




# Simple R program to read csv file> x <->read.csv>(>' D://Datas//myfile.csv '>)> > # print x> print>(x)>

>

>

산출:

 X V1 V2 V3 1 1 100 a1 b1 2 2 200 a2 b2 3 3 300 a3 b3>

예 3: 다른 구분 기호를 사용하여 CSV 파일 읽기

아르 자형




data <->read.csv>(>'path/to/your/file.csv'>, sep =>';'>)>

>

>

sep 옵션은 ; 이 예에서는 CSV 파일이 표준 쉼표(,) 대신 세미콜론(;)을 구분 기호로 사용하고 있음을 나타냅니다.

예 4: 첫 번째 행을 열 이름으로 처리

아르 자형

하위 문자열 자바




data <->read.csv>(>'path/to/your/file.csv'>, header =>TRUE>)>

>

>

헤더 인수가 TRUE로 설정되어 있으므로 CSV 파일의 첫 번째 행은 기본적으로 열 이름으로 처리됩니다. CSV 파일의 첫 번째 행에 열 이름이 포함되어 있지 않으면 header = FALSE를 설정하여 열 이름 없이 데이터를 가져올 수 있습니다.

예시 4: 열 클래스 지정

아르 자형




data <->read.csv>(>'path/to/your/file.csv'>,> >colClasses =>c>(>'character'>,>'numeric'>,>'integer'>))>

>

>

colClasses 옵션을 사용하여 CSV 파일의 각 열에 대한 클래스를 정의할 수 있습니다. 이 설명을 위해 첫 번째 열은 문자로, 두 번째 열은 숫자, 세 번째 열은 정수로 해석됩니다. 특정 열의 데이터 유형을 관리하려는 경우.

예 5: 행 건너뛰기 및 누락된 값 지정

아르 자형




data <->read.csv>(>'path/to/your/file.csv'>, skip = 3, na.strings =>c>(>''>,>'NA'>))>

>

>

Skip 인수를 사용하여 CSV 파일 시작 부분에서 특정 행 수를 건너뛸 수 있습니다. 이 그림의 처음 세 행은 생략됩니다. 결측값(NA)으로 간주되어야 하는 값은 an으로 지정됩니다. 문자열 인수. 이 상황에서는 NA 문자열과 빈 문자열이 모두 누락된 값으로 인식됩니다.