答えとして一つの質問他のウェブサイトからこのURLからデータを取得しようとすると、curl
次のような奇妙な違いが表示されます。wget
https://www.uniprot.org/uniprot/A2Z669.fasta
何らかの理由でファイルを正しくインポートするcurl
と、自動的にダウンロードが失敗します。wget
A2Z669.fasta
$ ls -la
total 300
drwxr-xr-x 2 terdon terdon 266240 Dec 11 12:22 .
drwxr-xr-x 202 terdon terdon 32768 Dec 10 17:31 ..
$ curl https://www.uniprot.org/uniprot/A2Z669.fasta
$ ls -la
total 300
drwxr-xr-x 2 terdon terdon 266240 Dec 11 12:22 .
drwxr-xr-x 202 terdon terdon 32768 Dec 10 17:31 ..
出力ファイルを明示的に設定することは役に立ちません。空のファイルを作成するだけです。
$ curl -o file "https://www.uniprot.org/uniprot/A2Z669.fasta"
% Total % Received % Xferd Average Speed Time Time Time Current
Dload Upload Total Spent Left Speed
0 0 0 0 0 0 0 0 --:--:-- --:--:-- --:--:-- 0
$ ls -la
total 300
drwxr-xr-x 2 terdon terdon 266240 Dec 11 12:25 .
drwxr-xr-x 202 terdon terdon 32768 Dec 10 17:31 ..
-rw-r--r-- 1 terdon terdon 0 Dec 11 12:25 file
$ cat file
$
しかし、wget
うまく動作します。
$ wget https://www.uniprot.org/uniprot/A2Z669.fasta
--2023-12-11 12:24:42-- https://www.uniprot.org/uniprot/A2Z669.fasta
Loaded CA certificate '/etc/ssl/certs/ca-certificates.crt'
Resolving www.uniprot.org (www.uniprot.org)... 193.62.193.81
Connecting to www.uniprot.org (www.uniprot.org)|193.62.193.81|:443... connected.
HTTP request sent, awaiting response... 301 Moved Permanently
Location: https://rest.uniprot.org/uniprot/A2Z669.fasta [following]
--2023-12-11 12:24:42-- https://rest.uniprot.org/uniprot/A2Z669.fasta
Resolving rest.uniprot.org (rest.uniprot.org)... 193.62.193.81
Connecting to rest.uniprot.org (rest.uniprot.org)|193.62.193.81|:443... connected.
HTTP request sent, awaiting response... 301 Moved Permanently
Location: https://rest.uniprot.org/uniprotkb/A2Z669.fasta [following]
--2023-12-11 12:24:43-- https://rest.uniprot.org/uniprotkb/A2Z669.fasta
Reusing existing connection to rest.uniprot.org:443.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/plain]
Saving to: ‘A2Z669.fasta’
A2Z669.fasta [ <=> ] 314 --.-KB/s in 0s
2023-12-11 12:24:43 (6.65 MB/s) - ‘A2Z669.fasta’ saved [314]
$ ls -la
total 304
drwxr-xr-x 2 terdon terdon 266240 Dec 11 12:24 .
drwxr-xr-x 202 terdon terdon 32768 Dec 10 17:31 ..
-rw-r--r-- 1 terdon terdon 314 Dec 11 12:24 A2Z669.fasta
特定のファイルに限定されているようではありません。同じREST APIで別のURLを試しました(https://www.uniprot.org/uniprot/P05067.fasta) 同じ行動を見せた。
私はArchシステムで実行しています。
$ wget --version | head -n1
GNU Wget 1.21.4 built on linux-gnu.
$ curl --version | head -n1
curl 8.4.0 (x86_64-pc-linux-gnu) libcurl/8.4.0 OpenSSL/3.1.4 zlib/1.3 brotli/1.1.0 zstd/1.5.5 libidn2/2.3.4 libpsl/0.21.2 (+libidn2/2.3.4) libssh2/1.11.0 nghttp2/1.58.0
ここで何が起こっているのでしょうか?wget
失敗した場合はどのように機能しますかcurl
?
答え1
wget
リダイレクトはデフォルトで従いますcurl
が、従っていません。以下を追加するとうまくいきます-L
。curl
curl -OL https://www.uniprot.org/uniprot/A2Z669.fasta
(デフォルトの動作と一致するように、標準出力ではなくファイルに出力を-O
指示します。)curl
wget