More Related Content
Similar to Data munging (20)
Data munging
- 1. #!/usr/bin/perl
use Jcode;
$out = 0; #回答箇所(「A:」から「Q:」の間に複数段落あっても対応)
while(<>)
{
chop;
$in = $_;
# $in = jcode($_)->
tr("ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz1234567890¥
.,…-=~%&#!¥¥¥^¥.¥$¥@¥;:¥'¥"¥*¥?¥|¥(¥)¥[¥]¥{¥}+/<>","ABCDEFGHIJKL
MNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz
1234567890.・・・ー=~%&#!\^.$@;:’
, ”*?|() {}+/<
[]
>") -> utf8;
$in =
jcode($_)->tr("A:BCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz12
34567890¥.,¥…-=~%&#!¥¥¥^¥.¥$¥@¥;:¥'¥"¥*¥?¥|¥(¥)¥[¥]¥{¥}+/<>",jcode("A:BC
DEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopq
rstuvwxyz1234567890.・ー=~%&#!\^.$@;:’
, ”*?|()
[]{}+/<>")->euc)->utf8;
next if($in =~ /^(/); #( )の行を削除
next if($in =~ /^《/); #《 》の行を削除
next if($in =~ /^〈/); #〈 〉の行を削除
if($in =~ s/^A://g or $in =~ s/^A1://g or $in =~ s/^A2://g or $in =~ s/^A
3://g or $in =~ s/^A4://g or $in =~ s/^A5://g or $in =~ s/^A6://g or $in =~ s/^A
7://g or $in =~ s/^A8://g or $in =~ s/^A9://g or $in =~ s/^B(奥さま)
://g or $in =~
s/^B://g or $in =~ s/^B(奥様)://g)
{
# $in =~ s/^ //g;#行頭の全角スペース削除
$out = 1;
}
if($in =~ /^Q:/ or
$in =~ /^Q1:/ or $in =~ /^Q2:/ or $in =~ /^Q3:/ or
- 2. $in =~ /^Q4:/ or $in =~ /^Q5:/ or $in =~ /^Q6:/ or
$in =~ /^Q7:/ or $in =~ /^Q8:/ or $in =~ /^Q9:/)
{
$out = 0;
}
if($out)
{
print $in."¥n";
}
}