[Python Cheatsheet] 39. Regex - 안전하게 쓰는 최소 패턴

정규표현식은 강력하지만 남용하면 가독성과 성능을 해칩니다. 이 치트시트는 re 모듈의 핵심 함수, 그룹/플래그, greedy vs non-greedy, 그리고 “언제 쓰지 말아야 하는지"를 정리합니다.

언제 이 치트시트를 보나?

문자열 메서드로는 어렵고, “패턴 추출/검증”이 필요할 때
성능/가독성 때문에 정규식 사용을 최소화하고 싶을 때

핵심 패턴

가능하면 startswith/endswith/split 같은 문자열 메서드를 먼저 고려
raw string: r"\d+" (백슬래시 이스케이프 혼란 방지)
위치 1개 찾기: search(), 전체 찾기: findall()/finditer()
greedy(.*)는 과하게 먹을 수 있음 → 필요하면 non-greedy(.*?)

최소 예제

1
2
3
4
import re

m = re.search(r"(\d+)", "id=123")
print(m.group(1))  # 123

1
2
3
4
5
# 이름 그룹
import re

m = re.search(r"(?P<user>[a-z]+)@(?P<domain>[\w.]+)", "a@ex.com")
print(m.groupdict())

1
2
3
4
5
6
# greedy vs non-greedy
import re

text = "<tag>hello</tag><tag>world</tag>"
print(re.findall(r"<tag>.*</tag>", text))    # greedy: 하나로 뭉칠 수 있음
print(re.findall(r"<tag>.*?</tag>", text))   # non-greedy: 개별 매칭

자주 하는 실수/주의점

match()는 문자열 시작부터, search()는 어디서든 찾음(의도 확인)
정규식이 길어지면 유지보수가 급락 → 작은 패턴으로 분해하거나 파서/문자열 처리로 대체
잘못된 패턴은 “과도한 백트래킹”으로 느려질 수 있음 → 단순한 패턴/앵커(^, $) 활용

[Python Cheatsheet] 39. Regex - 안전하게 쓰는 최소 패턴

정규표현식을 안전하게 쓰기 위한 치트시트입니다. re.search/match/findall/sub, 그룹/이름그룹, greedy vs non-greedy, flags, raw string, 과도한 백트래킹 회피 등 실무 함정을 최소 예제로 정리합니다.

언제 이 치트시트를 보나?

핵심 패턴

최소 예제

자주 하는 실수/주의점

관련 링크(공식 문서)

언제 이 치트시트를 보나?

핵심 패턴

최소 예제

자주 하는 실수/주의점

관련 링크(공식 문서)

[Python Cheatsheet] 파이썬 치트시트 커리큘럼의 관련 글들

[Python Cheatsheet] 37. datetime - timezone/파싱/포맷

[Python Cheatsheet] 38. zoneinfo - 표준 시간대 (Python 3.9+)

[Python Cheatsheet] 39. Regex - 안전하게 쓰는 최소 패턴 📍 현재 글

[Python Cheatsheet] 40. urllib.parse - URL 파싱과 조립

[Python Cheatsheet] 41. configparser & tomllib - INI/TOML 설정 파일

Related Content

[Python Cheatsheet] 35. JSON & CSV - 읽기/쓰기/인코딩

[Rust] Comprehensive Rust 무료 강의 정리 및 코스 구조

[Hardware] LattePanda Alpha에 Ubuntu 16.04 LTS 설치 가이드

[Python Cheatsheet] 50. hashlib & secrets - 해시/보안 난수 패턴

[Python Cheatsheet] 54. zipfile & tarfile - 압축 파일 읽기/쓰기/추출