번역:

English
Español
Français
Português do Brasil
中文版
日本語
한국어
Turkish
Greek
Magyar
Polish
Русский
Tiếng Việt
فارسی
עברית

정규표현식이란 무엇인가?

정규표현식은 텍스트에서 특정 패턴을 찾아내는데 사용되는 문자 혹은 기호들의 집합이다.

정규표현식(Regular expression)은 대상 문자열에 왼쪽에서 오른쪽 방향으로 매칭되는 하나의 패턴이다. "Regular expression"이라고 매번 발음하기 어렵기 때문에, 보통 약어로 "regex" 혹은 "regexp", "정규식"으로 축약되어 사용된다. 정규 표현식은 문자열 내부의 텍스트 대체, 포맷의 유효성 검사, 패턴 매칭을 기반으로한 문자열에서 일부 텍스트를 추출, 그리고 그 외에 다양한 목적을 위해 사용된다.

당신이 하나의 어플리케이션을 작성하고 있고 사용자가 사용자명을 선택할 때 사용되는 규칙들을 정하고 싶다고 상상해보자. 예를 들어, 우리는 사용자명에 문자, 숫자, 밑줄 문자(_), 그리고 하이픈이 포함되는 것은 허용하고 싶다. 또한, 사용자명의 글자수를 제한해서 사용자명이 지저분해보이지 않도록 하고 싶다. 이때 아래 정규표현식을 사용해 입력된 사용자명이 해당 규칙에 맞는지 검사할 수 있다.

위의 정규 표현식은 john_doe, jo-hn_doe, 그리고 john12_as 문자열을 받아들일 수 있다. Jo는 대문자를 포함하고 있고 길이가 너무 짧기 때문에 위의 정규표현식과 매칭되지 않는다.

1. 기본 매쳐

하나의 정규 표현식은 단지 텍스트 내부의 검색을 수행하기 위한 문자열의 패턴이다. 예를 들어, 정규 표현식 the는 문자 t 다음에 문자 h, 그 다음에 문자 e가 나오는 것을 의미한다.

"the" => The fat cat sat on the mat.

메타 문자	설명
.	온점(Period)는 줄바꿈을 제외한 어떤 종류의 단일 문자와 매치.
[ ]	문자 클래스. 대괄호 사이에 있는 문자들로 매치.
[^ ]	부정 문자 클래스. 대괄호 안에 포함되지 않은 모든 문자들로 매치.
*	이 메타 문자의 바로 앞에 있는 심볼이 0번 이상 반복된 문자들과 매치.
+	이 메타 문자의 바로 앞에 있는 심볼이 한번 이상 반복된 문자들과 매치.
?	이 메타 문자의 바로 앞에 있는 심볼을 선택적(optional)으로 만듬.
{n,m}	중괄호. 이 메타 문자의 바로 앞에 위치한 심볼이 최소 n번 최대 m번의 반복된 문자들과 매치.
(xyz)	문자 그룹. 문자열 xyz와 정확히 같은 순서를 가진 문자들과 매치.
\|	대안. 문자가 이 메타 문자의 앞에 있는 심볼이거나 뒤에 있는 심볼이면 매치.
\	다음 문자 이스케이프(Escape). 예약된 문자열들 `[ ] ( ) { } . * + ? ^ $ \ \|`을 이스케이핑함으로써 그 자체와 매칭되는 것을 허용.
^	입력의 시작과 매치.
$	입력의 끝과 매치.

단축형	설명
.	개행을 제외한 모든 문자
\w	영숫자 문자와 매치: `[a-zA-Z0-9_]`
\W	영숫자 문자가 아닌 문자와 매치: `[^\w]`
\d	숫자와 매치: `[0-9]`
\D	숫자가 아닌 문자와 매치: `[^\d]`
\s	공백 문자와 매치: `[\t\n\f\r\p{Z}]`
\S	공백 문자가 아닌 문자와 매치: `[^\s]`

부호	설명
?=	긍정형 전방탐색
?!	부정형 전방탐색
?<=	긍정형 후방탐색
?<!	부정형 후방탐색

플래그	설명
i	대소문자 구분없음: 매칭이 대소문자를 구분하지 않도록 설정.
g	전체 검색: 입력 문자열 전체를 대상으로 패턴을 검색.
m	멀티 라인: 앵터 메타 문자가 각 줄마다 동작하도록 설정.

Files

README-ko.md

Latest commit

History

README-ko.md

File metadata and controls

번역:

정규표현식이란 무엇인가?

목차

1. 기본 매쳐

2. 메타 문자

2.1 마침표

2.2 문자 집합

2.2.1 부정 문자 집합

2.3 반복

2.3.1 별 부호

2.3.2 덧셈 부호

2.3.3 물음표

2.4 중괄호

2.5 캡쳐링 그룹

2.5.1 논-캡쳐링 그룹

2.6 대안 부호

2.7 특수 문자 이스케이핑

2.8 앵커 부호

2.8.1 캐럿 부호

2.8.2 달러 부호

3. 단축형 문자열 집합

4. 전후방탐색

4.1 긍정형 전방탐색

4.2 부정형 전방탐색

4.3 긍정형 후방탐색

4.4 부정형 후방탐색

5. 플래그

5.1 대소문자 구분없음

5.2 전체 검색

5.3 멀티 라인

6. 탐욕적 vs 게으른 매칭

기여 방법

라이센스