1. 조건 : 해당 사이트 보면 타 중국 사이트에서 그대로 미러링한 소설이 있고, 각 유저가 각자 가져온 소설이 있습니다. 해당 확장 프로그램은 각 유저가 각자 가져온 소설 페이지에서 작동되도록 한 프로그램입니다. 어차피, 미러링한거면 미러링한 중국 사이트에서 직접 가져오면 되니까요
2. 해당 프로그램은 해당 사이트에서 각 단어를 선택하면 나오는 중국어 원문을 그대로 이어붙이도록 한거라 각 단어별로 띄어쓰기가 되어있습니다 .
원래는 그냥 알아서 처리하시라고 냅뒀는데, 용어집 사용하는 분들이 띄어쓰기 냅두면 잘 안먹힌다는 이야기가 있어서 그냥 띄어쓰기를 없애버리는 걸로 했습니다. 어차피 중국어는 띄어쓰기 개념이 없고.
3. 단일챕터, 벌크 추출이 있습니다. 단일 챕터는 이전과 기능이 동일한데, 예전에 텍스트 파일로 다운로드 하면 맨 위에 # 어쩌고저쩌고 뜨는 헤더 부분이 붙던걸 그냥 날려버렸습니다.
4. 벌크 추출은 소설의 목차 페이지에서 실행하시면 됩니다. 각 화가 있는 페이지가 아닌 '목차' 페이지입니다. 실행하면 범위 지정 몇화부터 몇화까지 추출할거냐고 나옵니다. 각 화를 선택하면 밑에
X화 추출 예정 · 예상 소요 약 15분
시작: 해당 화수 이름
끝 : 해당 화수 이름
뜨니 참조하시면 됩니다.
5. 추출을 시작하시면 진행상황을 확인할 수 있는 탭이 뜨면서 백그라운드에서 자동으로 작업이 진행되니 이제는 딴짓하셔도 됩니다. 완료되면 합친 텍스트 파일로 다운로드 할 수 있습니다. 차단과 캡차 회피를 위해 딜레이가 설정되어 있으니 유의해주십시오.
좀 쓰니 캡차 마구마구 걸더니 차단해버리네요. 벌크 추출은 쓰지 마세요;; 죄송합니다.
개선했습니다.
딜레이 조금 늘림
딜레이 랜덤화
실패시 재시도(3번까지)
추가해서 200화 연속 돌리는거 문제없이 돌아가는 것까지 확인했습니다.
그래도 가끔 안되긴 하는데, 빨간색으로 뜬 실패본은 몇개 안되네 그냥 수동으로 돌리면 되니 큰 문제는 아닐 듯?
다시 받아주시면 감사드리겠습니다.
>> 추가 개선. 서버 상태 안좋은 경우 대비하여 소설 페이지 열고 잠시 대기하도록 추가 수정.(반대급부로 소설 페이지 여는 딜레이는 줄임)
**만약 서버 상태가 좋거나 안 좋거나 하는 상황에 따라 딜레이를 조절하는 방법
background.js 편집 > await sleep(5000 + Math.random() * 1500); // ★★★ 페이지 열고 5~6.5초 충분히 대기 (AJAX 데이터 로드용) 구문 찾기 > 기본 설정이 페이지 열고 5~6.5초로 설정되어 있습니다. 조절하고 싶으시면 5000을 조정하시면 됩니다. 5000이 5초를 의미합니다. 서버 상태가 좋아서 속도를 빠르게 하고 싶다 하시면 줄이시면 되고, 안좋아서 늘리고 싶다 하시면 늘리시면 됩니다. 서버 상태에 따라 조절하시면 됩니다.
이전버전과 설치법은 동일해요> 크롬 > 확장프로그램 관리 > 개발자 모드 > 받은 파일 압축해제 > 압축해제된 확장 프로그램 로드
aHR0cHM6Ly9raW8uYWMvYy9kVE43NW1HZnZvR2RINkJBTDNDNTBi 구버전
개선판
aHR0cHM6Ly9raW8uYWMvYy9iR2VIcVEzWkNtUUpEMEI5MXJEUDBi
추가 개선판
aHR0cHM6Ly9raW8uYWMvYy9jckhWWTFpM2ZtSUxmMEVVUDlEUDBi
자체 번역판 페이지(lap ho)가 아니라 크롤링한 페이지에서도 오류 없이 추출되도록 한 새 개선판
aHR0cHM6Ly9raW8uYWMvYy9iQzcxSTcweVBWTC16MG8zX3BGUDBi
**참고 : 딜레이는 사실 5초 정도면 충분합니다. 차단당하셨거나 갑자기 딜레이가 5초보다 더 늘어났다 싶으신 분들은 확장프로그램 삭제하고 수동으로 페이지 들어가신 다음(소설 데이터가 완전히 뜰때까지 기다려야 합니다. 차단당하셨으면 차단 풀릴때까지 기다렸다 다시 접속) 다시 확장 프로그램 까시면 됩니다. 해당 사이트 자체에서 의심되면 그런 조치를 하는 것 같아요
국룰 1달
