ファイルを繰り返してインデックスを使用して単語を抽出するにはどうすればよいですか？

Question 1

各単語に対してこれを行うことができます。awkこれはメモリ要件を満たす必要があります。

awk -v RS=\  '{
    # Do something with the word
    print
}' file

を使用して希望の文字列を指定できますNR。

$ awk -v RS=\  'NR==2{print}' <<< 'foo bar baz'
bar

Answer

各単語に対してこれを行うことができます。awkこれはメモリ要件を満たす必要があります。

awk -v RS=\  '{
    # Do something with the word
    print
}' file

を使用して希望の文字列を指定できますNR。

$ awk -v RS=\  'NR==2{print}' <<< 'foo bar baz'
bar

Question 2

「文字列」といえば「単語」を意味するのでしょうか？スペースで区切られた文字列。あなたの例に基づいて順次アクセスしようとしています。

あなたはできます：

$ sed 's/[ \t]\+/\n/g' YOUR_FILE | while read -r word ; do PROCESS $word ; done

使用例：

% echo word1 word2 > YOUR_FILE
% echo word3 word4 >> YOUR_FILE
% echo word5 word6 >> YOUR_FILE
% sed 's/[ \t]\+/\n/g' YOUR_FILE | while read -r word ; do echo _${word}_ ; done
_word1_
_word2_
_word3_
_word4_
_word5_
_word6_

Answer

「文字列」といえば「単語」を意味するのでしょうか？スペースで区切られた文字列。あなたの例に基づいて順次アクセスしようとしています。

あなたはできます：

$ sed 's/[ \t]\+/\n/g' YOUR_FILE | while read -r word ; do PROCESS $word ; done

使用例：

% echo word1 word2 > YOUR_FILE
% echo word3 word4 >> YOUR_FILE
% echo word5 word6 >> YOUR_FILE
% sed 's/[ \t]\+/\n/g' YOUR_FILE | while read -r word ; do echo _${word}_ ; done
_word1_
_word2_
_word3_
_word4_
_word5_
_word6_

ファイルを繰り返してインデックスを使用して単語を抽出するにはどうすればよいですか？

答え1

答え2

関連情報