FTP 서버에서 재귀적으로 가져올 때 wget
특정 날짜 이후에 수정된 파일만 다운로드하는 방법은 무엇입니까 ?
사용 사례는 매일 밤 여러 서버와 동기화해야 하는데 며칠 전의 데이터만 필요하다는 것입니다. 해당 --mirror
플래그로 충분합니다. 나머지 데이터를 동기화하는 것만으로도(한 번이라도) 시간이 오래 걸립니다.
答え1
wget
한 번 미러링하면 --timestamp
해당 플래그가 있는 후속 항목만 가져올 수 있습니다. info
좋은 설명이 있는 해당 페이지를 읽고 이것이 원하는 동작을 제공하는지 확인하는 것이 좋습니다 .
答え2
아니요, wget을 통해서든 아니든 이미 한 번 동기화하지 않은 한 wget은 이를 지원하지 않습니다(이 경우 리소스 참조 --timestamp
).
시도해 볼 수 있는 몇 가지 해결 방법은 다음과 같습니다.
- 파일 이름이나 경로에 파일 수정 시간뿐만 아니라 날짜가 포함되어 있는 경우 regex/directory를 사용하여 이전 파일을 제외할 수 있습니다.
- 이외의 다른 것을 사용하십시오
wget
. 이는 전용 스크립트에 적합한 후보인 것 같습니다. 한 번에 하나의 파일에서만 wget을 사용할 수 있습니다. wpull을 볼 수도 있습니다. 저는 그것을 사용하지 않았지만 페이지를 다운로드해야 하는지 결정하기 위한 스크립팅의 wget과 유사하다는 것을 알고 있습니다. - FTP 외에 HTTP 다운로드 옵션이 있는 경우 특정 날짜 이후에 수정된 파일만 다운로드하는 사용자 정의 HTTP 캐시 지시어 헤더를 보낼 수 있습니다.