分享
 
 
 

功能丰富的Perl:用Perl读写Excel文件

王朝perl·作者佚名  2008-05-19
窄屏简体版  字體: |||超大  

Spreadsheet::WriteExcel 和 Spreadsheet::ParseExcel

在 2000 年,Takanori Kawai 和 John McNamara 编写出了 Spreadsheet::WriteExcel 和 Spreadsheet::ParseExcel 模块并将它们张贴在 CPAN 上,这两个模块使得在任何平台上从 Excel 文件抽取数据成为可能(尽管不容易)。

正如我们在稍后将看到的,如果您正在使用 Windows,Win32::OLE 仍提供一个更简单、更可靠的解决方案,并且 Spreadsheet::WriteExcel 模块建议使用 Win32::OLE 来进行更强大的数据和工作表操纵。Win32::OLE 带有 ActiveState Perl 工具箱,可以用来通过 OLE 驱动许多其它 Windows 应用程序。请注意,要使用此模块,您仍需要在机器上安装和注册一个 Excel 引擎(通常随 Excel 本身安装)。

需要解析 Excel 数据的应用程序数以千计,但是这里有几个示例:将 Excel 导出到 CSV、与存储在共享驱动器上的电子表格交互、将金融数据移至数据库以便形成报告以及在不提供任何其他格式的情况下分析数据。

要演示这里给出的示例,必须在您的系统上安装 Perl 5.6.0。您的系统最好是最近(2000 年或以后)的主流 UNIX 安装(Linux、Solaris 和 BSD)。虽然这些示例在以前版本的 Perl 和 UNXI 以及其他操作系统中也可以使用,但是您应该考虑到您将面对那些它们无法作为练习发挥作用的情况。

Windows 示例:解析

本节仅适用于 Windows 机器。所有其它各节适用于 Linux。

在进行之前,请安装 ActiveState Perl(这里使用版本 628)或 ActiveState Komodo IDE 以编辑和调试 Perl。Komodo 为家庭用户提供一个免费许可证,您大概在几分钟之内就可以得到它。(有关下载站点,请参阅本文后面的参考资料。)

使用 ActiveState PPM 软件包管理器安装 Spreadsheet::ParseExcel 和 Spreadsheet::WriteExcel 模块是困难的。PPM 没有历史记录,难以设置选项,帮助会滚出屏幕并且缺省方式是忽略相关性而安装。您可以从命令行输入“ppm”然后发出以下命令来调用 PPM:

清单 1:安装 Excel 模块的 PPM 命令

ppm install OLE::Storage_Lite

ppm install Spreadsheet::ParseExcel

ppm install Spreadsheet::WriteExcel

在这种情况下,该模块的安装将失败,因为 IO::Scalar 还不可用,因此,您可能想放弃 PPM 问题的查找,而转向内置的 Win32::OLE 模块。然而,在您阅读本文时,ActiveState 可能已经发布了该问题的修正。

有了 ActiveState 的 Win32::OLE,您可以使用下面所列的代码逐个单元地转储工作表:

下载 win32excel.pl

清单 2:win32excel.pl

#!/usr/bin/perl -w

use strict;

use Win32::OLE qw(in with);

use Win32::OLE::Const 'Microsoft Excel';

$Win32::OLE::Warn = 3;

# die on errors...

# get already active Excel application or open new

my $Excel = Win32::OLE-GetActiveObject('Excel.Application')

|| Win32::OLE-new('Excel.Application', 'Quit');

# open Excel file

my $Book = $Excel-Workbooks-Open("c:/komodo projects/test.xls");

# You can dynamically obtain the number of worksheets, rows, and columns

# through the Excel OLE interface.

Excel's Visual Basic Editor has more

# information on the Excel OLE interface.

Here we just use the first

# worksheet, rows 1 through 4 and columns 1 through 3.

# select worksheet number 1 (you can also select a worksheet by name)

my $Sheet = $Book-Worksheets(1);

foreach my $row (1..4)

{

foreach my $col (1..3)

{

# skip empty cells

next unless defined $Sheet-Cells($row,$col)-{'Value'};

# print out the contents of a cell

printf "At ($row, $col) the value is %s and the formula is %s\n",

$Sheet-Cells($row,$col)-{'Value'},

$Sheet-Cells($row,$col)-{'Formula'};

}

}

# clean up after ourselves

$Book-Close;

请注意,您可以用以下方式很轻松地为单元分配值:

$sheet-Cells($row, $col)-{'Value'} = 1;

Linux 示例:解析

本节适用于 UNIX,特别适用于 Linux。没有在 Windows 中测试它。

很难给出一个比 Spreadsheet::ParseExcel 模块文档中所提供的示例更好的 Linux 解析示例,因此我将演示那个示例,然后解释其工作原理。

下载 parse-excel.pl

清单 3:parse-excel.pl

#!/usr/bin/perl -w

use strict;

use Spreadsheet::ParseExcel;

my $oExcel = new Spreadsheet::ParseExcel;

die "You must provide a filename to $0 to be parsed as an Excel file" unless @ARGV;

my $oBook = $oExcel-Parse($ARGV[0]);

my($iR, $iC, $oWkS, $oWkC);

print "FILE

:", $oBook-{File} , "\n";

print "COUNT :", $oBook-{SheetCount} , "\n";

print "AUTHOR:", $oBook-{Author} , "\n"

if defined $oBook-{Author};

for(my $iSheet=0; $iSheet {SheetCount} ; $iSheet++)

{

$oWkS = $oBook-{Worksheet}[$iSheet];

print "--------- SHEET:", $oWkS-{Name}, "\n";

for(my $iR = $oWkS-{MinRow} ;

defined $oWkS-{MaxRow} && $iR {MaxRow} ;

$iR++)

{

for(my $iC = $oWkS-{MinCol} ;

defined $oWkS-{MaxCol} && $iC {MaxCol} ;

$iC++)

{

$oWkC = $oWkS-{Cells}[$iR][$iC];

print "( $iR , $iC ) =", $oWkC-Value, "\n" if($oWkC);

}

}

}

此示例是用 Excel 97 测试的。如果它不能工作,则试着将它转换成 Excel 97 格式。Spreadsheet::ParseExcel 的 perldoc 页也声称了 Excel 95 和 2000 兼容性。

电子表格被解析成一个名为 $oBook 的顶级对象。$oBook 具有辅助程序的特性,例如“File”、“SheetCount”和“Author”。 Spreadsheet::ParseExcel 的 perldoc 页的工作簿一节中记载了这些特性。

该工作簿包含几个工作表:通过使用工作簿 SheetCount 特性迭代它们。每个工作表都有一个 MinRow 和 MinCol 以及相应的 MaxRow 和 MaxCol 特性,它们可以用来确定该工作簿可以访问的范围。Spreadsheet::ParseExcel perldoc 页的工作表一节中记载了这些特性。

可以通过 Cell 特性从工作表获得单元;那就是清单 3 中获得 $oWkC 对象的方式。Spreadsheet::ParseExcel 的 perldoc 页的 Cell 一节中记载了 Cell 特性。根据文档,似乎没有一种方式能够获得特定单元中列出的公式。

Linux 示例:写入

本节适用于 UNIX,特别适用于 Linux。没有在 Windows 中测试它。

Spreadsheet::WriteExcel 在 Examples 目录中带有许多示例脚本,通常可以在 /usr/lib/perl5/site_perl/5.6.0/Spreadsheet/WriteExcel/examples 下找到这些脚本。它可能被安装在其它各处;如果找不到那个目录,请与您的本地 Perl 管理员联系。

坏消息是 Spreadsheet::WriteExcel 无法用于写入现有 Excel 文件。必须自己使用 Spreadsheet::ParseExcel 从现有 Excel 文件导入数据。好消息是 Spreadsheet::WriteExcel 与 Excel 5 直至 Excel 2000 兼容。

这里有一个程序,它演示如何从一个 Excel 文件抽取、修改(所有数字都乘以 2)数据以及将数据写入新的 Excel 文件。只保留数据,不保留格式和任何特性。公式被丢弃。

下载 excel-x2.pl

清单 4:excel-x2.pl

#!/usr/bin/perl -w

use strict;

use Spreadsheet::ParseExcel;

use Spreadsheet::WriteExcel;

use Data::Dumper;

# cobbled together from examples for the Spreadsheet::ParseExcel and

# Spreadsheet::WriteExcel modules

my $sourcename = shift @ARGV;

my $destname = shift @ARGV or die "invocation: $0 ";

my $source_excel = new Spreadsheet::ParseExcel;

my $source_book = $source_excel-Parse($sourcename)

or die "Could not open source Excel file $sourcename: $!";

my $storage_book;

foreach my $source_sheet_number (0 .. $source_book-{SheetCount}-1)

{

my $source_sheet = $source_book-{Worksheet}[$source_sheet_number];

print "--------- SHEET:", $source_sheet-{Name}, "\n";

# sanity checking on the source file: rows and columns should be sensible

next unless defined $source_sheet-{MaxRow};

next unless $source_sheet-{MinRow}

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
推荐阅读
 
 
 
>>返回首頁<<
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有