~ 안에 파이썬, 문자열 작업은 프로그래밍의 기본 측면입니다. 문자열 일련의 문자이며 종종 처리하거나 분석해야 하는 구조화된 데이터를 포함합니다. 문자열에 대해 수행되는 일반적인 작업은 분할과 구문 분석입니다.
Python에서 문자열 분할하기
Python에서는 다음을 사용하여 문자열을 더 작은 부분으로 나눌 수 있습니다. split()> 방법과 split()> 메소드는 구분 기호를 인수로 사용하고 하위 문자열 목록을 반환하는 구분 기호가 나타날 때마다 문자열을 끊습니다.
구문:
문자열.분할(구분자)
매개변수:
-
delimiter>: 문자열이 분할될 문자 또는 부분 문자열입니다. 선택적 매개변수입니다.
반환 값:
그만큼 split()> 방법 구분 기호가 나타날 때 원래 문자열을 끊어서 얻은 하위 문자열 목록을 반환합니다.
str.split() 메서드
이 메서드는 지정된 구분 기호를 기반으로 문자열을 하위 문자열 목록으로 분할합니다. 문자열 안녕하세요, techcodeview.com에 오신 것을 환영합니다. 쉼표(',')를 구분 기호로 사용합니다. 그만큼 분할() 함수 구분 기호를 사용하여 문자열을 하위 문자열 목록으로 분리하여 [Hello Welcome to techcodeview.com]를 포함하는 목록 A를 생성합니다.
예 :
파이썬
# Define a string containing> string>=> 'Hello,Welcome,to,techcodeview.com'> # Use the split() method to split the string into> A>=> string.split(>','>)> # Print the resulting list> print>(A)> |
>
>
출력 :
['Hello', 'Welcome', 'to', 'techcodeview.com']>
str.rsplit() 메서드
이는 다음과 유사합니다. str.split() , 그러나 문자열의 오른쪽에서 분할됩니다. 주어진 코드는 rsplit() 함수를 사용하여 마지막 쉼표(',') 발생을 기준으로 문자열 S를 두 부분으로 분할합니다. 결과는 분할 전후의 부품을 포함하는 목록입니다. A는 될 것이다 ['Hello to World', '파이썬'] 마지막 쉼표로 구분된 부분은 파이썬 문자열의 나머지 부분과 분리되어 있습니다. 안녕하세요 세계 .
예 :
파이썬
# Given string> S>=> 'Hello,to,World,Python'> A>=> S.rsplit(>','>,>1>)> # Printing the result> print>(A)> |
Java 메소드의 배열
>
>
출력 :
['Hello,to,World', 'Python']>
str.splitlines() 메서드
이 메서드는 줄바꿈에서 문자열을 분할하고 줄 목록을 반환합니다. 코드는 개행 문자로 구분된 세 줄의 텍스트로 문자열 M을 정의합니다. 그런 다음 분할선() 메서드 문자열을 line이라는 목록으로 분할하고 각 요소는 원래 문자열의 한 줄을 나타냅니다. 마지막으로 코드는 행 목록의 내용을 인쇄합니다.
예 :
파이썬
# Define a string with three lines of> # text separated by newline characters> M>=> 'GFG 1
GFG 2
GFG 3'> # Use the splitlines() method to split> line>=> M.splitlines()> print>(line)> |
>
유닉스 최상위 명령
>
출력 :
['GFG 1', 'GFG 2', 'GFG 3']>
str.partition() 메서드
이 방법 문자열을 분할합니다 구분 기호의 첫 번째 발생을 기준으로 세 부분으로 나눕니다. 코드는 분할() 구분 기호가 처음 나타나는 위치에서 문자열 Text를 분할하는 메서드입니다. 구분 기호 앞 부분을 before 변수에 할당하고 구분 기호 자체를 변수 sep에 할당하며 구분 기호 뒤 부분을 변수 after에 할당합니다.
예 :
파이썬
# Input string> Text>=> 'Mango,Orange,apple'> before, sep, after>=> Text.partition(>','>)> # Printing the part of the string before the separator> print>(before)> print>(after)> |
>
>
출력 :
Mango Orange,apple>
re.split() 메서드
re 모듈은 정규식을 사용하여 더욱 강력한 문자열 분할을 제공합니다. 코드는 다시 분할() Python의 re 모듈에서 함수를 사용하여 숫자 존재 여부에 따라 텍스트 문자열을 분할합니다. 요소가 숫자로 구분된 텍스트의 하위 문자열인 목록 P를 생성합니다. 출력은 문자열이 숫자 '1'에서 분할되었음을 나타내는 ['Mango,Orange', 'Banana']입니다.
예 :
파이썬
import> re> # Input text containing a mix of> # alphabetic characters and digits> Text>=> 'Mango,Orange1Banana'> P>=> re.split(r>'d'>, Text)> # Printing the resulting list of substrings> print>(P)> |
>
>
출력 :
['Mango,Orange', 'Banana']>
목록 이해 사용
당신이 사용할 수있는 목록 이해 문자열을 분할하고 빈 문자열을 필터링합니다. 코드는 분할(',')을 사용하여 문자열 Text를 쉼표로 분할한 다음 목록 이해를 사용하여 선행 또는 후행 공백을 제거한 후 비어 있지 않은 부분을 포함하는 목록 P를 만듭니다. 출력은 다음을 포함하는 목록 P입니다. ['망고', '오렌지', '바나나']. 이 코드는 분할 결과에서 빈 부분을 효과적으로 제거하고 추가 공간을 잘라냅니다.
예 :
파이썬
C# 스위치
# Given input string> Text>=> 'Mango,Orange,Banana'> # Split the input string by commas and filter out empty parts using list comprehension> P>=> [part>for> part>in> Text.split(>','>)>if> part.strip()]> # print> print>(P)> |
>
>
출력 :
['Mango', 'Orange', 'Banana']>
~ 안에 파이썬 , 문자열을 구문 분석한다는 것은 주어진 문자열에서 의미 있는 정보를 추출하는 것을 의미하며, 이 과정에는 문자열을 원하는 데이터 유형으로 변환하거나 문자열에서 특정 데이터 패턴을 추출하는 작업이 포함됩니다.
정수 또는 부동 소수점으로 변환
문자열에 숫자 데이터가 포함된 경우. 다음을 사용하여 정수 또는 부동 소수점 데이터 유형으로 구문 분석할 수 있습니다.int()>그리고float()>기능을 각각 수행합니다. 주어진 코드는 문자열 52를 정수로 변환하고 결과(52)를 인쇄합니다. 마찬가지로 문자열 4.17을 부동 소수점 숫자로 변환하고 결과(4.17)를 인쇄합니다. 이는 Python에서 문자열을 해당 숫자 데이터 유형으로 변환하기 위해 int() 및 float() 함수를 사용하는 방법을 보여줍니다.
파이썬
# Convert a string to an integer> number_str>=> '52'> number_int>=> int>(number_str)> print>(number_int)> # Convert a string to a floating-point number> decimal_str>=> '4.17'> decimal_float>=> float>(decimal_str)> print>(decimal_float)> |
>
>
출력 :
52 4.17>
결론
위에서 언급한 이러한 방법을 사용하면 문자열을 분할하고 구문 분석할 수 있습니다. 또한 정수를 부동 소수점으로 변환하는 방법과 Split() 메서드를 사용하는 방법도 살펴보겠습니다. 문자열을 더 작은 부분으로 나누는 방법 구분자를 기준으로 합니다.