Rewrote in Perl for easy charset handling
This commit is contained in:
parent
2552b38965
commit
7aa8246502
|
@ -3,6 +3,9 @@ include GNUmakerules
|
||||||
|
|
||||||
all: charhist
|
all: charhist
|
||||||
|
|
||||||
|
charhist: charhist.pl
|
||||||
|
cp $^ $@
|
||||||
|
|
||||||
chartab:
|
chartab:
|
||||||
clean:
|
clean:
|
||||||
rm -f charhist core foo bar baz
|
rm -f charhist core foo bar baz
|
||||||
|
|
|
@ -0,0 +1,40 @@
|
||||||
|
#!/usr/bin/perl
|
||||||
|
use warnings;
|
||||||
|
use strict;
|
||||||
|
use Getopt::Long;
|
||||||
|
use Pod::Usage;
|
||||||
|
use autodie;
|
||||||
|
|
||||||
|
my $encoding;
|
||||||
|
|
||||||
|
GetOptions('encoding=s', \$encoding) or pod2usage();
|
||||||
|
|
||||||
|
my %hist;
|
||||||
|
if (@ARGV) {
|
||||||
|
readfile($_) for @ARGV;
|
||||||
|
} else {
|
||||||
|
readfile();
|
||||||
|
}
|
||||||
|
|
||||||
|
binmode STDOUT, ":encoding(UTF-8)";
|
||||||
|
for (sort keys %hist) {
|
||||||
|
my $cp = ord;
|
||||||
|
printf("%x %d %o %s\t%d\n", $cp, $cp, $cp, /\p{Graph}/ ? $_ : ".", $hist{$_});
|
||||||
|
}
|
||||||
|
|
||||||
|
sub readfile {
|
||||||
|
my ($filename) = @_;
|
||||||
|
my $fh;
|
||||||
|
if (defined $filename) {
|
||||||
|
open $fh, "<", $filename;
|
||||||
|
} else {
|
||||||
|
$fh = \*STDIN;
|
||||||
|
|
||||||
|
}
|
||||||
|
binmode $fh, ":encoding($encoding)";
|
||||||
|
while (<$fh>) {
|
||||||
|
for my $c (split(//)) {
|
||||||
|
$hist{$c}++;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
Loading…
Reference in New Issue