
サブシーンから字幕をダウンロードしました。http://subscene.com/subtitles/the-5th-wave/english/1298314これには、私のプレーヤーmpvでデコードされていない:<i>
などのいくつかのエンコーディングが含まれています。</i>
ご覧のとおり、字幕は.srt(Subrip Text)形式です。
https://matroska.org/technical/specs/subtitles/srt.html
以下は、理解できるように完全な会話です。
28
00:03:37,080 --> 00:03:39,280
CASSIE:<i> I miss the Cassie I was.</i>
ゲームプレイ中にコードが見えないように修正したいのですが、どのように修正するのかわかりません。誰でも助けることができますか? Debian でテストしており、mpv を使用しています。
[$] mpv --version
(null) requires an argument
mpv 0.14.0 (C) 2000-2015 mpv/MPlayer/mplayer2 projects
built on UNKNOWN
ffmpeg library versions:
libavutil 54.31.100
libavcodec 56.60.100
libavformat 56.40.101
libswscale 3.1.101
libavfilter 5.40.101
libswresample 1.2.101
ffmpeg version: 2.8.6-1+b2
この問題が解決されることを期待しています。このコードは.srtファイル全体に広がっているので、せいぜい少し混乱しています。
答え1
誰かが字幕にHTMLタグを使用してフォントを作成しようとしていたようです。イタリック体。 HTMLに関する私の限られた知識で<
表現記号は、less than
すなわち表現です。だから<
>
>
CASSIE:<i> I miss the Cassie I was.</i>
次のように可視化できます。
CASSIE:<i> I miss the Cassie I was.</i>
イタリック体のコードであることが簡単にわかります。ビデオプレーヤーはhtmlタグを認識しません。私はそれらが選択されたsed / awkの組み合わせで削除できると確信しています。
sed 's/\<\;i\>\;//; s+\<\;/i\>\;++' somefile.srt >somefile-nohtml.srt