SlideShare a Scribd company logo
1 of 2
#!/usr/bin/perl


use Jcode;


         $out = 0; #回答箇所(「A:」から「Q:」の間に複数段落あっても対応)


while(<>)
{
         chop;
         $in = $_;
#        $in                                 =                            jcode($_)->
tr("ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz1234567890¥
.,…-=~%&#!¥¥¥^¥.¥$¥@¥;:¥'¥"¥*¥?¥|¥(¥)¥[¥]¥{¥}+/<>","ABCDEFGHIJKL
MNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz
1234567890.・・・ー=~%&#!\^.$@;:’
           ,                ”*?|() {}+/<
                                  []
>") -> utf8;


$in                                                                                =
jcode($_)->tr("A:BCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz12
34567890¥.,¥…-=~%&#!¥¥¥^¥.¥$¥@¥;:¥'¥"¥*¥?¥|¥(¥)¥[¥]¥{¥}+/<>",jcode("A:BC
DEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopq
rstuvwxyz1234567890.・ー=~%&#!\^.$@;:’
                    ,               ”*?|()
[]{}+/<>")->euc)->utf8;
         next if($in =~ /^(/); #(         )の行を削除
         next if($in =~ /^《/); #《         》の行を削除
         next if($in =~ /^〈/); #〈         〉の行を削除
         if($in =~ s/^A://g or $in =~ s/^A1://g or $in =~ s/^A2://g or $in =~ s/^A
3://g or $in =~ s/^A4://g or $in =~ s/^A5://g or $in =~ s/^A6://g or $in =~ s/^A
7://g or $in =~ s/^A8://g or $in =~ s/^A9://g or $in =~ s/^B(奥さま)
                                                                ://g or $in =~
s/^B://g or $in =~ s/^B(奥様)://g)
         {
#                    $in =~ s/^ //g;#行頭の全角スペース削除
                     $out = 1;
         }
                     if($in =~ /^Q:/ or
                     $in =~ /^Q1:/ or $in =~ /^Q2:/ or $in =~ /^Q3:/ or
$in =~ /^Q4:/ or $in =~ /^Q5:/ or $in =~ /^Q6:/ or
               $in =~ /^Q7:/ or $in =~ /^Q8:/ or $in =~ /^Q9:/)
    {
               $out = 0;
    }
    if($out)
    {
               print $in."¥n";
    }
}

More Related Content

Viewers also liked

Viewers also liked (7)

Forces Behind The Connected Car
Forces Behind The Connected CarForces Behind The Connected Car
Forces Behind The Connected Car
 
Spiritwax&wane
Spiritwax&waneSpiritwax&wane
Spiritwax&wane
 
84-85 08ay live report demi lovato acc revisi
84-85 08ay live report demi lovato acc revisi84-85 08ay live report demi lovato acc revisi
84-85 08ay live report demi lovato acc revisi
 
RE/MAX 2013 Dominates Canadian RealTrends 250 - #1 Average Transactions Per A...
RE/MAX 2013 Dominates Canadian RealTrends 250 - #1 Average Transactions Per A...RE/MAX 2013 Dominates Canadian RealTrends 250 - #1 Average Transactions Per A...
RE/MAX 2013 Dominates Canadian RealTrends 250 - #1 Average Transactions Per A...
 
Tugas blogger
Tugas bloggerTugas blogger
Tugas blogger
 
Cемінарммо
CемінарммоCемінарммо
Cемінарммо
 
10
1010
10
 

Similar to Data munging

Ação em Petroilina
Ação em PetroilinaAção em Petroilina
Ação em PetroilinaJamildo Melo
 
Panduan Penyusunan KOSP. okumen kurikulum operasional di satuan pendidikan pe...
Panduan Penyusunan KOSP. okumen kurikulum operasional di satuan pendidikan pe...Panduan Penyusunan KOSP. okumen kurikulum operasional di satuan pendidikan pe...
Panduan Penyusunan KOSP. okumen kurikulum operasional di satuan pendidikan pe...HardyantoHinda
 
超絶技巧プログラミングの世界(FTD2015)
超絶技巧プログラミングの世界(FTD2015)超絶技巧プログラミングの世界(FTD2015)
超絶技巧プログラミングの世界(FTD2015)mametter
 
Developments in The Qt WebKit Integration
Developments in The Qt WebKit IntegrationDevelopments in The Qt WebKit Integration
Developments in The Qt WebKit Integrationaccount inactive
 
شبكات الكمبيوتر
شبكات الكمبيوترشبكات الكمبيوتر
شبكات الكمبيوترmohamednacim
 
شبكات الكمبيوتر من البداية حتى الاحتراف
شبكات الكمبيوتر من البداية حتى الاحترافشبكات الكمبيوتر من البداية حتى الاحتراف
شبكات الكمبيوتر من البداية حتى الاحترافاحمد الجسار
 
対応点を用いないローリングシャッタ歪み補正と映像安定化ポスター
対応点を用いないローリングシャッタ歪み補正と映像安定化ポスター対応点を用いないローリングシャッタ歪み補正と映像安定化ポスター
対応点を用いないローリングシャッタ歪み補正と映像安定化ポスターdoboncho
 
メンテできないコードをメンテする技術
メンテできないコードをメンテする技術メンテできないコードをメンテする技術
メンテできないコードをメンテする技術Tomoya Ishida
 
4.1. Harvey Neoliberalismo.pdf
4.1. Harvey Neoliberalismo.pdf4.1. Harvey Neoliberalismo.pdf
4.1. Harvey Neoliberalismo.pdfBeluuGonzalez3
 
Perl Hobby Programming - Games::BeLike::EightBIT ターミナルで8ビット風ゲームをつくろう
Perl Hobby Programming - Games::BeLike::EightBIT ターミナルで8ビット風ゲームをつくろうPerl Hobby Programming - Games::BeLike::EightBIT ターミナルで8ビット風ゲームをつくろう
Perl Hobby Programming - Games::BeLike::EightBIT ターミナルで8ビット風ゲームをつくろうkeroyonn
 
Bentolila jimeno2002 LA REFORMA DE LA NEGOCIACIÓN EN ESAÑA
Bentolila jimeno2002 LA REFORMA DE LA NEGOCIACIÓN EN ESAÑABentolila jimeno2002 LA REFORMA DE LA NEGOCIACIÓN EN ESAÑA
Bentolila jimeno2002 LA REFORMA DE LA NEGOCIACIÓN EN ESAÑAEfiaulaOpenSchool
 
جنازي نماز جو طريقو
جنازي نماز جو طريقوجنازي نماز جو طريقو
جنازي نماز جو طريقوIlyas Qadri Ziaee
 
ใบความรู้ที่ 2.9 แทรกรูปภาพ
ใบความรู้ที่ 2.9 แทรกรูปภาพใบความรู้ที่ 2.9 แทรกรูปภาพ
ใบความรู้ที่ 2.9 แทรกรูปภาพSamorn Tara
 
怪物曲線2 - evalの復習
怪物曲線2 - evalの復習怪物曲線2 - evalの復習
怪物曲線2 - evalの復習Hexomino Hexomino
 
Communications orales du caisp 2012
Communications orales du caisp 2012Communications orales du caisp 2012
Communications orales du caisp 2012Réseau Pro Santé
 
01Business n°2165 - Gare aux Espions !
01Business n°2165 - Gare aux Espions !01Business n°2165 - Gare aux Espions !
01Business n°2165 - Gare aux Espions !alain Clapaud
 

Similar to Data munging (20)

Ação em Petroilina
Ação em PetroilinaAção em Petroilina
Ação em Petroilina
 
Panduan Penyusunan KOSP. okumen kurikulum operasional di satuan pendidikan pe...
Panduan Penyusunan KOSP. okumen kurikulum operasional di satuan pendidikan pe...Panduan Penyusunan KOSP. okumen kurikulum operasional di satuan pendidikan pe...
Panduan Penyusunan KOSP. okumen kurikulum operasional di satuan pendidikan pe...
 
超絶技巧プログラミングの世界(FTD2015)
超絶技巧プログラミングの世界(FTD2015)超絶技巧プログラミングの世界(FTD2015)
超絶技巧プログラミングの世界(FTD2015)
 
Metas
MetasMetas
Metas
 
Ol genomgång
Ol genomgångOl genomgång
Ol genomgång
 
Developments in The Qt WebKit Integration
Developments in The Qt WebKit IntegrationDevelopments in The Qt WebKit Integration
Developments in The Qt WebKit Integration
 
شبكات الكمبيوتر
شبكات الكمبيوترشبكات الكمبيوتر
شبكات الكمبيوتر
 
شبكات الكمبيوتر من البداية حتى الاحتراف
شبكات الكمبيوتر من البداية حتى الاحترافشبكات الكمبيوتر من البداية حتى الاحتراف
شبكات الكمبيوتر من البداية حتى الاحتراف
 
対応点を用いないローリングシャッタ歪み補正と映像安定化ポスター
対応点を用いないローリングシャッタ歪み補正と映像安定化ポスター対応点を用いないローリングシャッタ歪み補正と映像安定化ポスター
対応点を用いないローリングシャッタ歪み補正と映像安定化ポスター
 
メンテできないコードをメンテする技術
メンテできないコードをメンテする技術メンテできないコードをメンテする技術
メンテできないコードをメンテする技術
 
4.1. Harvey Neoliberalismo.pdf
4.1. Harvey Neoliberalismo.pdf4.1. Harvey Neoliberalismo.pdf
4.1. Harvey Neoliberalismo.pdf
 
Perl Hobby Programming - Games::BeLike::EightBIT ターミナルで8ビット風ゲームをつくろう
Perl Hobby Programming - Games::BeLike::EightBIT ターミナルで8ビット風ゲームをつくろうPerl Hobby Programming - Games::BeLike::EightBIT ターミナルで8ビット風ゲームをつくろう
Perl Hobby Programming - Games::BeLike::EightBIT ターミナルで8ビット風ゲームをつくろう
 
Bentolila jimeno2002 LA REFORMA DE LA NEGOCIACIÓN EN ESAÑA
Bentolila jimeno2002 LA REFORMA DE LA NEGOCIACIÓN EN ESAÑABentolila jimeno2002 LA REFORMA DE LA NEGOCIACIÓN EN ESAÑA
Bentolila jimeno2002 LA REFORMA DE LA NEGOCIACIÓN EN ESAÑA
 
جنازي نماز جو طريقو
جنازي نماز جو طريقوجنازي نماز جو طريقو
جنازي نماز جو طريقو
 
ใบความรู้ที่ 2.9 แทรกรูปภาพ
ใบความรู้ที่ 2.9 แทรกรูปภาพใบความรู้ที่ 2.9 แทรกรูปภาพ
ใบความรู้ที่ 2.9 แทรกรูปภาพ
 
怪物曲線2 - evalの復習
怪物曲線2 - evalの復習怪物曲線2 - evalの復習
怪物曲線2 - evalの復習
 
Communications orales du caisp 2012
Communications orales du caisp 2012Communications orales du caisp 2012
Communications orales du caisp 2012
 
01Business n°2165 - Gare aux Espions !
01Business n°2165 - Gare aux Espions !01Business n°2165 - Gare aux Espions !
01Business n°2165 - Gare aux Espions !
 
agroquimicos_compress.pdf
agroquimicos_compress.pdfagroquimicos_compress.pdf
agroquimicos_compress.pdf
 
釧路OSS7月勉強会
釧路OSS7月勉強会釧路OSS7月勉強会
釧路OSS7月勉強会
 

Data munging

  • 1. #!/usr/bin/perl use Jcode; $out = 0; #回答箇所(「A:」から「Q:」の間に複数段落あっても対応) while(<>) { chop; $in = $_; # $in = jcode($_)-> tr("ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz1234567890¥ .,…-=~%&#!¥¥¥^¥.¥$¥@¥;:¥'¥"¥*¥?¥|¥(¥)¥[¥]¥{¥}+/<>","ABCDEFGHIJKL MNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz 1234567890.・・・ー=~%&#!\^.$@;:’ , ”*?|() {}+/< [] >") -> utf8; $in = jcode($_)->tr("A:BCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz12 34567890¥.,¥…-=~%&#!¥¥¥^¥.¥$¥@¥;:¥'¥"¥*¥?¥|¥(¥)¥[¥]¥{¥}+/<>",jcode("A:BC DEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopq rstuvwxyz1234567890.・ー=~%&#!\^.$@;:’ , ”*?|() []{}+/<>")->euc)->utf8; next if($in =~ /^(/); #( )の行を削除 next if($in =~ /^《/); #《 》の行を削除 next if($in =~ /^〈/); #〈 〉の行を削除 if($in =~ s/^A://g or $in =~ s/^A1://g or $in =~ s/^A2://g or $in =~ s/^A 3://g or $in =~ s/^A4://g or $in =~ s/^A5://g or $in =~ s/^A6://g or $in =~ s/^A 7://g or $in =~ s/^A8://g or $in =~ s/^A9://g or $in =~ s/^B(奥さま) ://g or $in =~ s/^B://g or $in =~ s/^B(奥様)://g) { # $in =~ s/^ //g;#行頭の全角スペース削除 $out = 1; } if($in =~ /^Q:/ or $in =~ /^Q1:/ or $in =~ /^Q2:/ or $in =~ /^Q3:/ or
  • 2. $in =~ /^Q4:/ or $in =~ /^Q5:/ or $in =~ /^Q6:/ or $in =~ /^Q7:/ or $in =~ /^Q8:/ or $in =~ /^Q9:/) { $out = 0; } if($out) { print $in."¥n"; } }