누가 올려달라고 하셔서 재처리 하는법을 적어봅니다
매우 길고 복잡? 할수 있는데 기존에 번역하시던 분이나 각자 원래 방식대로 하시던분은 참고 정도만 해주세요
간단하고 생각했는데 다 적고보니 좀 기네요
몇년동안 직접 번역한거나 받은 파일 수정하면서 이렇게 수렴해서 고정된 결과물입니다
그냥 저만의 기준이니 얼마든지 변형하시더나 맘에 드시면 해당부분이나 전체 과정을 사용하시면 될듯 합니다
지금 제 기준에서 작게는 검수 상태 좋은 파일이거나 내용이 작으면 십몇분에서 ai가 만안들어서 오래 걸리는고+파일도 크고 바꿀 내용 많아도 길어도 한시간 정도 걸립니다
읽기 전에 나중에 안봐도 그냥 맘에 드는거나 보고 싶은거는 일단 이 기준으로 모두 다 처리합니다
재처리후 작업다된 버젼은 한글만 있는 기준이고 도망시사(悼亡詩社, 망자를 애도하는 시인들의 모임이라는 뜻) 같은 고사성어나 아주 일부 한자만 남기는 형식입니다
1. 번역된 파일(이하 원본), 노트패드++, 파워쉘(Shift+우클릭으로 열기), 구글스프레드 시트, Textedit(강제개행정리), 구글 aistudio를 준비한다 (순서에 맞게 필요할때 마다 사용)
2. 괄호안에 있는 한자 제거
노트패드에서 원문을 열고 정규식 기준으로
\([^)]*?[一-龟]+\)
\([一-龟]+[^)]*?\)
\([^)]*[一-龟]+[^)]*\)
3가지를 찾을 내용에 각자 넣고 바꿀내용을 빈칸으로 두고 바꿔줍니다[찾기-컨트롤f] [찾아바꾸기-컨트롤h](보통 찾기로 한 후에 탭 바꾸서 검색합니다)
할때마다 바로 안바꾸고 먼저 현재 문서에서 전체 찾기로 확인후에 바꿔주기 때문에 필요한 경우에 한자를 남기는 경우가 있습니다
3. 각종 외국어 검색
찾을내용에 넣고
[a-z]+|[а-я]+|[ぁ-ゔ]+|[ァ-ヴー]+[々〆〤]+ [ÀÁÂÃÈÉÊÌÍÒÓÔÕÙÚĂĐĨŨƠàáâãèéêìíòóôõùúăđĩũơƯĂẠẢẤẦẨẪẬẮẰẲẴẶẸẺẼỀỀỂưăạảấầẩẫậắằẳẵặẹẻẽềềểỄỆỈỊỌỎỐỒỔỖỘỚỜỞỠỢỤỦỨỪễếệỉịọỏốồổỗộớờởỡợụủứừỬỮỰỲỴÝỶỸửữựỳỵỷỹ]+
두가지 경우를 각자 검색합니다
필요하신 경우에 해당 외국어 유니코드나 문자열 정규식 찾아서 검색하시면 됩니다
영어가 좀 많을 경우에는 따로 검색해서 수정합니다
해당케이스가 적으면 노트패드 밑에 나오는 찾기 결과들에서 그냥 복사해서 ai스튜디오에서 번역을 요청하거나
책갈피로 줄을 책갈피에 체크하고 [책갈피-컨트롤m]
모두찾기 한후 상단의 메뉴에서 찾기(s)-책갈피(b)-책갈피 된 줄 복사하기 를 눌러줍니다 컨트롤 n으로 새로운 문서를 열고 복붙해둔 뒤에
마찬가지로 번역을 요청합니다
4. 한자(한글), 한글(한글) 수정
찾을내용
[一-龟]+ *\(([가-힝]+)\) *
바꿀내용
\1
검색후에 반噬(서) 같은 경우만 있으면 일괄 수정하고
직접 수정해야하는 경우도 있습니다 반서噬(서) 같이 일부 케이스 들이 있음
반서(반서)같은 경우 제거
찾을내용
([가-힣]+)\(\1\)
바꿀내용
$1
5. 괄호 검색후 제거
찾을내용에
\(.+\)
을 넣고 검색한 후에
불필요한 케이스를 전부 찾아서 제거합니다
괄호안에 월표, 후원감사표시, 업데이트 (본장완) 같은 케이스 입니다
따로 새 문서에 저장해서 보시거나 저는 찾기 결과들에서 하나씩 해결후 다시 \(.+\) 검색해서 찾는편입니다
\(월표.+\) or \(.+월표.+\) 검색 바꿀내용 비워두고 일괄 수정
이런식으로 하거나 2번에서 한것처럼 \([^)]*?[一-龟]+\) 여기서 [一-龟]+ 대신에 찾을 내용 여기에 대신 넣고 검색 3번 하시는 방법도 가능합니다
예시
\(본.+\)
\(이.+\)
\(.+끝\)
\(.+료\)
이런식으로 찾아서 다 수정하면 됩니다
6. 누락장수 중복 체크하기
보통은 거의 없이 올라오기때문에 거의 하지 않는 편인데 나중에 한자 검색시에 중복이 눈에 띄게 보이면 다시 체크하는 편입니다
🟢제1장 낙백의 개미왕(落魄蚁王)
이런식이면
🟢제[0-9]+장.+
검색후에 결과물 갯수랑 편수 비교하고 상당한 차이를 보이면 (몇십화에서 몇백화)
장수표기형식이 다른 경우라서 그 경우도 찾아서 정규식으로 통일시키거나 누락 체크만 합니다
누락이 없으면 여기서 끝이고 누락이 있거나 중복이 있으면 검색을 책갈피로 해서
마찬가지로 줄을 책갈피 체크 하시고 새 문서에 두고 1장부터 확인하면서 누락이 있으면 번역후에 채워넣기 중복은 제거합니다
누락은 원문 사이트 찾아서 전후 장수 구글 자체 번역기준으로 확인후에 누락확인되면 복사해서 ai스튜디오에서 번역후에 채워넣고
중복은 클릭후 쉬프트 누른채로 페이지 다운으로 가서 제거합니다(클릭가능)
7. 번역할 한자 검색후 전처리(해당 줄수가 찾으면 생략)
찾을내용
[一-龟]+
검색으로 먼저 확인하고 내용이 적으면 생략하고
많으면 책갈피로 줄을 책갈피 체크 한 후에 책갈피 모두 지우기-모두찾기-책갈피한 문자 복사하기
한후에 새문서에 붙여넣기 한후에 600줄 정도 이하이면 그냥 바로 스튜디오에서 번역 요청하는편입니다
(찾기 결과들에서 눈에 띄게 같은 한자가 많이 보이면 아래 과정을 합니다)
줄수가 좀 많거나 한자가 중복이 대놓고 좀 보이면
책갈피로 줄을 책갈피 체크해제 한 후에 책갈피 모두 지우기-모두찾기-책갈피한 문자 복사하기
그후에 스프레드 시트에가서 붙여넣기 해줍니다
저는 구글 스프레드 시트 사용합니다
b열기준으로 쓰기때문에 기존에 사용하던 b열 을 전체 삭제후에 붙여넣기 해주고
옆에 다른 아무 칸에
=QUERY(B:B, "SELECT B, COUNT(B) WHERE B IS NOT NULL GROUP BY B ORDER BY COUNT(B) DESC LABEL B '항목', COUNT(B) '개수'")
를 입력해줍니다(한번 해두면 계속 유지해도됨, 해당시트 기준으로 즐겨찾기 해둔상태)
그러면 갯수별로 한자가 쭉 뜹니다 원문에서 괄호한자만 제거 한 기준으로 3096개
槭 1278
纷纷 466
藜 461
湛蓝 53
螅 52
得意 36
蚱 21
靛 20
芡 18
不等 15
凝重 14
安排 14
嘶 13
翅 13
蛰伏 13
示意 12
争取 11
思路 11
考察 11
提升 10
得意洋洋 9
沼气池 9
蔦蘿 9
初步 8
参观 8
察觉 8
弥漫 8
忍不住 8
那边 8
擂台战 7
算了 7
荻 7
弋 6
掌握 6
推广 6
陆续 6
榔 5
纷纷纷纷 5
蟄伏 5
轻易 5
이런식으로 뜹니다
여기서 선택인데 저는 보통 6개까지 먼저 전처리를 합니다
https://dict.naver.com/
네이버 어학사전기준으로 보통 원하시는 갯수 까지 검색하고
수정중인 원문에서 마찬가지로 검색후에
安排 안배 같은 경우
-대란과 야향이 번갈아 사용하도록安排하게
-"합리적인安排입니다!"
이런 케이스면
찾을내용
安排
바꿀내용
안배
로 수정하고
아닐경우에는 빈칸없이 한글로 수정해줍니다
일반 단어 명사, 의성어 같은 경우는 이런식으로 일괄 수정이 보통 가능하고
부사 같은 경우는 케바케입니다
필요없는 경우에 해당 단어가 너무많으면 일괄 삭제하거나 표현 하나로 일괄 수정되면 수정하고
필요한 경우에 표현이 다양하게 변형되면 넘겨서 다음과정으로 넘깁니다
8. 스튜디오에서 번역하기
다시 수정중인 원문에서
찾을내용
[一-龟]+
검색으로 먼저 확인하고 내용이 적으면 생략하고
많으면 책갈피로 줄을 책갈피 체크 한 후에 책갈피 모두 지우기-모두찾기-책갈피한 문자 복사하기
를 똑같이 반복하고 구글 ai스튜디오에서 번역합니다
프롬프트는 기존에 사용하시던거나 검색후에 하시고 괄호한자에 대한 부분은 없이 사용합니다(제 기준)
결과물이 나오면 새 문서에 붙여넣기 한 후에 그 문서를 우클릭-move document-move to other view를 클릭하면
반반 갈라져서 문서가 나옵니다 그 후에 결과물에서 또 [一-龟]+ 한자를 검색합니다
여기서 한자가 상당히 많이 나오면 프롬프트를 수정하거나 ai를 갈궈서 재대로 번역시켜야하고
갯수가 10개 언저리 미만이면 그냥 위랑 같은 방식으로 복사해서(책갈피로 줄을 책갈피해서 복사)
번역을 요청해서 해당줄만 따로 부분적으로 수정해줍니다
해당 줄수가 같으면 다음과정으로 넘어가고 줄수가 다르면
(제 프롬프트에서는 작가의 말 삭제할때 있어서 광고나 월표 이야기 삭제해서 안맞을때 있음)
그 후에 번역전에 복사해둔 한자가 있는 문서랑 번역된 문서를 양쪽에 두고 메뉴-플러그인-compose-compose로 검색해서
줄수를 맞추거나 불피요한 부분 삭제하거나 '룡' 모양으로 (지금 해당한자가 기억이 안남) 같이 삭제 필요가 없는 한자 같은 경우를 삭제하거나
수정해줍니다
9. 일괄 수정(몇백줄 한번에 하는법)
예전에는 일일히 한줄식 수정했는데 너무 힘들어서 처리 포기했다가 멍청한거 깨닿고 ai로 해결방법을 찾아서 쓰는중입니다
이때까지 처리된 문서를 저장해서 원본.txt 에 저장해줍니다
번역전 한자.txt 번역된 파일은 한글.txt 에 저장합니다
3가지 파일 모두 crlf-utf-8 기준입니다
(이건 스크립트에서 각자 수정하면됨)
3가지를 같은 폴더내에 두고
쉬프트- 우클릭-여기서 파워쉘 창 열기
로 해당폴더에서 열고 로딩을 기다린다음에
# 스크립트 시작 시 시간 기록
$startTime = Get-Date
# 오류 발생 시 스크립트 중단 설정
$ErrorActionPreference = "Stop"
# --- 설정 값 ---
# 시스템 메모리에 맞춰 최대한 늘려보세요. 예를 들어 50000 -> 200000 또는 그 이상
$chunkSize = 200000 # 한 번에 처리할 라인 수 (청크 크기) - 대폭 증가
$outputStreamWriterBufferKB = 256 # 출력 파일 스트림 버퍼 크기(KB). 예: 64KB, 128KB, 256KB 등
# ---------------
# 파일 경로 설정
$hanjaFilePath = "G:\번역\한자.txt"
$hangeulFilePath = "G:\번역\한글.txt"
$targetFilePath = "G:\번역\원본.txt"
$outputFilePath = "G:\번역\결과파일.txt"
# 진행 상황 표시 함수
function Write-ProgressEnhanced {
param (
[string]$Activity,
[string]$CurrentOperation,
[int]$PercentComplete
)
$statusMessage = "$CurrentOperation ($PercentComplete`%)" # % 문자 이스케이프
Write-Progress -Activity $Activity -Status $statusMessage -PercentComplete $PercentComplete
}
# 한자-한글 매핑 정보 읽기 (Dictionary 사용)
$hanjaHangeulMap = New-Object 'System.Collections.Generic.Dictionary[string, string]'
try {
Write-ProgressEnhanced -Activity "데이터 준비" -CurrentOperation "한자/한글 파일 읽는 중" -PercentComplete 10
$hanjaLines = Get-Content -Path $hanjaFilePath -Encoding UTF8
$hangeulLines = Get-Content -Path $hangeulFilePath -Encoding UTF8
if ($hanjaLines.Count -ne $hangeulLines.Count) { throw "한자 파일과 한글 파일의 라인 수가 일치하지 않습니다." }
Write-ProgressEnhanced -Activity "데이터 준비" -CurrentOperation "매핑 테이블 생성 중 ($($hanjaLines.Count)개)" -PercentComplete 50
for ($i = 0; $i -lt $hanjaLines.Count; $i++) {
if (-not [string]::IsNullOrWhiteSpace($hanjaLines[$i])) {
if (-not $hanjaHangeulMap.ContainsKey($hanjaLines[$i])) {
$hanjaHangeulMap.Add($hanjaLines[$i], $hangeulLines[$i])
}
# else { Write-Warning "한자 목록에 중복된 키 '$($hanjaLines[$i])'가 있습니다. 첫 번째 항목으로 유지됩니다." }
}
}
Write-ProgressEnhanced -Activity "데이터 준비" -CurrentOperation "매핑 완료" -PercentComplete 100
Write-Host "한자-한글 매핑 정보 읽기 완료: $($hanjaHangeulMap.Count)개 매핑"
} catch {
Write-Error "한자-한글 매핑 정보 읽기 실패: $($_.Exception.Message)"; exit
}
# 변환 작업 및 결과 파일 저장 (청크 단위)
try {
Write-Host "변환 작업 시작 (청크 단위 처리, MatchEvaluator 사용)..."
$escapedHanjaKeys = $hanjaHangeulMap.Keys | ForEach-Object { [regex]::Escape($_) }
$regexPattern = ""
if($escapedHanjaKeys.Count -gt 0) {
$regexPattern = ($escapedHanjaKeys) -join '|'
}
# MatchEvaluator 스크립트 블록이 외부 $hanjaHangeulMap 변수를 참조할 수 있도록 .GetNewClosure() 사용
$replacer = {
param($match)
if ($hanjaHangeulMap.ContainsKey($match.Value)) {
return $hanjaHangeulMap[$match.Value]
}
return $match.Value # 매핑에 없는 경우 원본 값 유지
}.GetNewClosure()
# Regex 객체 생성 (선택적: 패턴이 매우 길거나, Compiled 옵션 사용 시)
$regex = $null
if (-not [string]::IsNullOrEmpty($regexPattern)) {
# PowerShell 5.1 에서는 RegexOptions.Compiled 가 항상 큰 이득을 주지는 않을 수 있음
# $regex = New-Object System.Text.RegularExpressions.Regex($regexPattern, [System.Text.RegularExpressions.RegexOptions]::Compiled)
$regex = [regex]$regexPattern # 간단한 방법
}
$totalLines = 0
if (Test-Path $targetFilePath) {
Write-Host "대상 파일 전체 라인 수 계산 중..."
# 효율적인 라인 수 계산 (이미 잘 되어 있음)
$lineCounterReader = New-Object System.IO.StreamReader($targetFilePath, [System.Text.Encoding]::UTF8)
while ($null -ne $lineCounterReader.ReadLine()) { $totalLines++ }
$lineCounterReader.Close(); $lineCounterReader.Dispose()
Write-Host "대상 파일 총 라인 수: $totalLines"
} else {
throw "대상 파일 '$targetFilePath'를 찾을 수 없습니다."
}
$processedLines = 0
# 출력 파일 쓰기 준비 (버퍼 크기 지정)
$outputWriterBufferSizeBytes = $outputStreamWriterBufferKB * 1024
$outputWriter = New-Object System.IO.StreamWriter($outputFilePath, $false, [System.Text.Encoding]::UTF8, $outputWriterBufferSizeBytes)
$newLine = [System.Environment]::NewLine # NewLine 캐싱
Get-Content -Path $targetFilePath -Encoding UTF8 -ReadCount $chunkSize | ForEach-Object {
$currentChunkLines = $_
$chunkAsString = $currentChunkLines -join $newLine # 청크 내 라인들을 하나의 문자열로
$processedChunk = $chunkAsString # 기본값
if ($regex -ne $null) { # 정규식 객체가 있을 때만 변환
# $processedChunk = $chunkAsString -replace $regexPattern, $replacer # 기존 방식
$processedChunk = $regex.Replace($chunkAsString, $replacer) # Regex 객체 사용
}
$outputWriter.Write($processedChunk)
# 현재 청크가 마지막 청크가 아니라면, 다음 청크와의 연결을 위해 줄바꿈 추가
# (Get-Content -ReadCount는 청크의 마지막 줄 다음에 줄바꿈을 보장하지 않음)
# ($chunkAsString은 이미 내부적으로 줄바꿈을 포함)
# 이 조건은 현재 청크가 파일의 끝이 아님을 의미
if (($processedLines + $currentChunkLines.Count) -lt $totalLines) {
$outputWriter.Write($newLine)
}
$processedLines += $currentChunkLines.Count
$percentComplete = 0
if ($totalLines -gt 0) {
$percentComplete = [Math]::Floor(($processedLines / $totalLines) * 100)
}
$progressStatus = "청크 처리 중... (약 $processedLines"
if ($totalLines -gt 0) { $progressStatus += "/$totalLines" }
$progressStatus += " 라인)"
Write-ProgressEnhanced -Activity "변환 작업" -CurrentOperation $progressStatus -PercentComplete $percentComplete
}
$outputWriter.Close(); $outputWriter.Dispose()
Write-ProgressEnhanced -Activity "변환 작업" -CurrentOperation "모든 청크 처리 완료" -PercentComplete 100
Write-Host "변환 작업 완료."
} catch {
if ($outputWriter -ne $null -and $outputWriter.BaseStream -ne $null -and $outputWriter.BaseStream.CanWrite) {
$outputWriter.Close(); $outputWriter.Dispose()
}
Write-Error "변환 작업 또는 파일 저장 실패: $($_.Exception.Message)"; exit
}
# 스크립트 종료
$endTime = Get-Date
$executionTime = New-TimeSpan -Start $startTime -End $endTime
Write-Host ""
Write-Host "=================================================="
Write-Host "모든 작업 완료: '$targetFilePath' -> '$outputFilePath'"
Write-Host "총 실행 시간: $($executionTime.ToString())"
Write-Host "=================================================="
를 복사해서 언터 누르면 결과파일이 생성됩니다
해당 스크립트는 한자파일에서 원문파일에서 검색후에 해당 줄을 대칭되는 한글 파일에 해당하는 줄로 삭제를 자동 진행하는 스크립트입니다
# --- 설정 값 ---
# 시스템 메모리에 맞춰 최대한 늘려보세요. 예를 들어 50000 -> 200000 또는 그 이상
$chunkSize = 200000 # 한 번에 처리할 라인 수 (청크 크기) - 대폭 증가
$outputStreamWriterBufferKB = 256 # 출력 파일 스트림 버퍼 크기(KB). 예: 64KB, 128KB, 256KB 등
# ---------------
# 파일 경로 설정
$hanjaFilePath = "G:\번역\한자.txt"
$hangeulFilePath = "G:\번역\한글.txt"
$targetFilePath = "G:\번역\원본.txt"
$outputFilePath = "G:\번역\결과파일.txt"
여기서 파일 경로는 각자 필요하신 폴더나 파일명으로 바꾸시면 되고
$chunkSize는 각자 해보시고 조금씩 수정해서 빠른 경우로 하시면 됩니다
저는 대충 이 스크립트 쓰거나 살짝 다른 버젼 두개 혼용해서 사용중입니다
원문 파일이 클수록, 바꿀 내용이 많을수록 느려지는데
보통 아무리 많아도 몇분내고 300줄 정도는 몇십초에서 1분 컷됩니다(많아도 몇분 내외라서 다른거 하고오면 됨)
메모리랑 cpu둘다 거의 안쓰고 되게 수정된 버젼이라서 다른 작업이나 활동에 지장이 전혀 없습니다
해당 스크립트는 ai로 필요하신 부분 수정하거나 파이썬으로 바꿔서 사용하시거나 ai이용해서 요청하시면됩니다
만약에 스크립트를 복붙해서 엔터 눌렀을때 파일 진행표시가 없어나 빨간 텍스트가 뜨면서 되지 않으면
한글, 한자 파일 줄수가 안맞거나 먼가 오류가 있는데 파워쉘 내용을 전체 복사해서 (오류포함) ai에게 상황을 알려주면서 안되는 이유를 물어보시고 수정해서 사용하시면 될듯 합니다
10. 제목 중복, 작가의 말, 추신, ps, 월표요청 삭제
(마지막에 하거나 중간중간에 아무때나 다 가능 저도 그때그때 다릅니다)
(결과파일 기준에서 하거나 그 전에 할경우에는 수정중이 원본에서 합니다)
제목중복
제1장 낙백의 개미왕
제1장 낙백의 개미왕
찾을내용
(^(제[0-9]+:?장\s+[^\r\n]*)\s*\r\n\r\n)(?=\1)
검색하고 해당 케이스 있으면
빈칸으로 바꾸기
이건 완전히 같은 경우만 되고 같은 장수가 하나는 음차 한글풀이 다른 경우는 하나씩 수정하거나 정규식으로(계속 하다보니 검색하면서 조금씩 배움) 수정합니다
월표요청이나 작가의말 이런 경우
시작단어[\s\S]*?(?=다음장 정규식)
예시
ps[\s\S]*?(?=제[0-9]+장 [가-힣]+)
추신[\s\S]*?(?=제[0-9]+장 [가-힣]+)
.+本章完[\s\S]*?(?=第[0-9]+章.+)
.+후원.+감사.+[\s\S]*?(?=제[0-9]+장.+)
이런식으로 검색해서 빈칸으로 두고 수정하면 되는데
*반드시* 책갈피 기능으로 줄을 책갈피 체크해제 상태에서 새문서에 붙여넣기 한후에
본문 내용이 들어간 경우는 각자 따로 수정하고
다시 해당 케이스로 검색해서 다시 재 확인 한후에 본문내용이 없을때 일괄 수정합니다
11. 강제 개행정리
노트패드에서
찾을내용
\r\n\r\n
바꿀내용
\r\n
으로 일괄수정 반복하고
\r\n
\r\n\r\n
으로 바꿔서 한번 해줍니다(시간이 문서 크기에 따라서 꽤 많이 걸림)
Textedit 프로그램
https://sunshower135.blogspot.com/search/label/%ED%94%84%EB%A1%9C%EA%B7%B8%EB%9E%A8
마지막 수정파일(저는 아까 결과파일이나 풀검수 다운받은경우는 원본파일)을 uft-16으로 수정해서 저장하고
(다른이름으로 저장하면 저장 왼쪽에 인코딩이 표시됨)
프로그램 열어서 드래그 하거나 파일 열어주고 모두 다 체크해제하고
중간에 한줄씩 더 띄우기 만 체크해서
에딧 눌러줍니다
(이러면 한줄 빈칸 한줄 무한반복으로 강제 개행정리됨)
빈줄이 여러개거나 없거나 모두 한줄씩 넣어 줍니다
수정된 파일을 열어서 맨마지막에 광고 문구 제거, uft-16으로 수정(utf-8보다 용량이 작음)하면 보통 끝입니다
////
외전.간단한 정규식 몇개 사용법, 마루앱 기준으로 핸드폰에서 pc연동?해서 편하게 보기
마루기준으로 경로에서+눌러서
smb추가 누른후 와이파이 기준으로 주소랑 계정 암호 각자 입력해서 추가하고
번역본 저장해두는 파일을 네트워크폴더 추가해서 사용하시면
따로 파일 옮길 필요없이 바로 받아서 보거나
수정사항이 있으면 수정후에 제목은 유지한 상태에서 동기화 해서 사용합니다
smb나 이런거는 저도 1도 몰라서 다 구글링해서 배워서 써먹고 있는데 정말로 정말로 소설 보시는분이면 꼭 필수 입니다
진짜 편합니다
정규식은 간단하게
줄바꿈 문자
\r\n
언어
[0-9]
[a-z]
[а-я]
[一-龟]
여기서 [a-z] 는 a에서 z까지 아무거나 하나씩 있는 경우인데
두글자는 [aa-zz] 이런식으로 검색해야하는데
[a-z]+ +를 붙이면 [a-z]반복한 경우로 검색해줍니다
각종기호는 정규식에서 쓰는 문자라서 따로 검색할려면 앞에 \를 붙여야 합니다
\(, \[ 등등
스페이스바
\s
.(점) 점하나는 모든 문자 대응이라서
.+검색하면 모든 줄입니다
그래서 위에서 괄호 검색할때 \(.+\)으로 검색합니다
각종 수정사항에 필요한 정규식은 하시다보면 늘어나거나 필요한경우에 구글링하거나 ai한테 물어보면서 하면 늘어나는거 같습니다
제가 실제로 하는 과정을 쭉 적어 봤는데 수정사항이나 안되는 경우는 댓글남겨주시면 저도 고민해서 되도록 수정하거나 해결해볼게요(안될수도 있음)