平均行を同じパターンにする

Question 1

おそらくあなたが探している答えではありませんが、とにかく興味深いでしょう。

#!/usr/bin/env perl

use strict;
use warnings;

use DBI;

my $dbh = DBI->connect(
    'dbi:CSV:',
    undef, undef, {
        f_ext           => '.csv/r',
        csv_sep_char    => "\t",
        csv_quote_char  => undef,
        csv_escape_char => undef,
    }
);

my $sth = $dbh->prepare(
    'SELECT AVG(pvalue), AVG(padj), ko, pathway
    FROM data GROUP BY ko, pathway'
);
$sth->execute();

while ( my $row = $sth->fetchrow_arrayref ) {
    printf "%.2f\t%.2f\t%s\t%s\n", @$row;
}

$dbh->disconnect;

上記は、データがタブ区切りのCSVファイルにあると想定していますdata.csv。

Answer

おそらくあなたが探している答えではありませんが、とにかく興味深いでしょう。

#!/usr/bin/env perl

use strict;
use warnings;

use DBI;

my $dbh = DBI->connect(
    'dbi:CSV:',
    undef, undef, {
        f_ext           => '.csv/r',
        csv_sep_char    => "\t",
        csv_quote_char  => undef,
        csv_escape_char => undef,
    }
);

my $sth = $dbh->prepare(
    'SELECT AVG(pvalue), AVG(padj), ko, pathway
    FROM data GROUP BY ko, pathway'
);
$sth->execute();

while ( my $row = $sth->fetchrow_arrayref ) {
    printf "%.2f\t%.2f\t%s\t%s\n", @$row;
}

$dbh->disconnect;

上記は、データがタブ区切りのCSVファイルにあると想定していますdata.csv。

Question 2

たぶんGNUはdatamashあなたのためのものかもしれません：

$ datamash -H -g3,4 mean 1 mean 2 < file
GroupBy(ko) GroupBy(pathway)    mean(pvalue)    mean(padj)
ko00620 Pyruvatemetabolism  15,373333333333 0,0066666666666667
ko00051 Fructoseandmannosemetabolism    12,215  0,005

Answer

たぶんGNUはdatamashあなたのためのものかもしれません：

$ datamash -H -g3,4 mean 1 mean 2 < file
GroupBy(ko) GroupBy(pathway)    mean(pvalue)    mean(padj)
ko00620 Pyruvatemetabolism  15,373333333333 0,0066666666666667
ko00051 Fructoseandmannosemetabolism    12,215  0,005

Question 3

awkを使う

awk '
    NR == 1 {print;next} 
    {
        n[$3]++
        val[$3] += $1
        adj[$3] += $2
        path[$3] = $4
    } 
    END {
        for (ko in n) 
            printf "%.2f %.2f %s %s\n", val[ko]/n[ko], adj[ko]/n[ko], ko, path[ko]
    }
' file | column -t

Answer

awkを使う

awk '
    NR == 1 {print;next} 
    {
        n[$3]++
        val[$3] += $1
        adj[$3] += $2
        path[$3] = $4
    } 
    END {
        for (ko in n) 
            printf "%.2f %.2f %s %s\n", val[ko]/n[ko], adj[ko]/n[ko], ko, path[ko]
    }
' file | column -t

平均行を同じパターンにする

答え1

答え2

答え3

関連情報