端末からファイルをダウンロード

端末からファイルをダウンロード

端末を使用して.txtファイルをダウンロードしようとしています。リンクは次のとおりです(リンクを開いた直後にダウンロードが開始されます)。

https://es.osdn.net/projects/sfnet_kaldi/downloads/wsj0-train-spkrinfo.txt

コマンドを使用してダウンロードしようとしました。

wget "https://es.osdn.net/projects/sfnet_kaldi/downloads/wsj0-train-spkrinfo.txt"

残念ながら、コマンドの実行後に得られる唯一の結果はページソースです。

端末からこのファイルをダウンロードする正しい方法が何であるかを教えてくれる人はいますか?

よろしくお願いします!

答え1

HTMLによると、コンテンツの実際のソースを隠すためにいくつかのトリックを行います。

ダウンロードしたいファイルは、以下を使用してファイルを取得したソースからダウンロードできます。

 wget http://jaist.dl.sourceforge.net/project/kaldi/wsj0-train-spkrinfo.txt

したがって、Unixの知識が不足しているというのではなく、結局は意図的​​に鈍感になるのです。

また、ホームページからこのプロジェクトのすべてのファイルにアクセスできます。https://sourceforge.net/projects/kaldi/files/(元のリンクで指す以前のバージョン)

そこに行くと、最新バージョンがあることがわかります。https://github.com/kaldi-asr/kaldi

答え2

あなたのリンクは、テキストファイルリンクのように「見え」、あなたが試した方法でダウンロードする必要がありますwget。すべての作業を正しく行いました。問題は、サイトを運営している人が「狡猾に」行動していることです。彼らはリンクが実際のテキストファイルではないようにサイトを設定し、ユーザーがWebインターフェースを閲覧し、少なくとも1回クリックするように強制したいと考えています。私はこのようなサイトが嫌いですが、そのコンテンツはルールです。

他の人が回避策を提案するかもしれませんが、回避策はすべてのサイトで機能するわけではなく、必ずしも同じサイトの他のページでも機能するわけではありません。

答え3

ページ自体に実際には次のように表示されます。

wget -O wsj0-train-spkrinfo.txt \
     'https://es.osdn.net/frs/g_redir.php?m=kent&f=kaldi%2Fwsj0-train-spkrinfo.txt'

しかし、残念ながら、これに関する一般的な規則はなく、ページの実装によって異なります。

関連情報