簡単に画像を抜き出せるOffice拡張子の裏ワザ

簡単に画像を抜き出せるOffice拡張子の裏ワザ

たしかMicrosoft Office 2007あたりから、WordやExcelの拡張子が変わった事を知ってますか?

もしかすると今20代の社会人は、知らない人もいるかもしれませんが、マイクロソフトが、Officeに色々な機能を追加していって、ファイルの仕様が古いままだと、保存しても復元できなくなったんだと思います。

ソフト名変更前の拡張子変更後の拡張子
Excelxlsxlsx
Worddocdocx
PowerPointpptpptx

今現在は、「変更後の拡張子」を迷いもなく使っているかと思いますが、マイクロソフトが変更を加えてきた直後は、互換性を失ってしまって大パニックでした。

何故なら、Office 2007で作られたxlsx拡張子のファイルをOffice 2003のバージョンしか導入していない(アップデートをしていないか)会社宛てに添付資料で送ると、もちろん、このファイルを見ることが出来ず、もらった方は、送った方に、「古い拡張子で保存しなおしてください」と、頭を下げて、再送してもらう・・・

という具合でした。

この騒動で誰しもがマイクロソフトの新バージョンへの移行を余儀なくされてしまい、当時、とある上場会社の情報システム部署で社内ソフトウェアの管理を行なっていた僕は、予算も取っていないのに、緊急で導入したという苦い経験があり、あまりいい思い出では無かったんです。

マイクロソフトの戦略か、便利になるための施策だったのか?

会社内にパソコンがある所で、Officeソフトウェアが入っていない会社などおそらく探すほうが難しいぐらいの普及率だったと思います。
※あくまで僕の認識している範囲です。

長期間にわたり寡占化が続いたため、バージョンはまちまちでした。必ずしも全員がアップデートしていない状況では、下位互換性が無いと困る会社も多かったと思います。

そのためファイル拡張子の変更は売り上げ欲しさの強制アップデートじゃないかと勘ぐってしまい、売り上げを上げるために、なんて酷いことをするのかと、怒っていた時期も有りました。

つい最近、この新しいファイルに裏ワザがある事を会社で知り、驚いたという内容を共有したいと思います。

docxフィアルは圧縮ファイルだった

Wordで作ったファイルを拡張子「docx」で保存し、その拡張子を「zip」に変更して、zip解凍すると、フォルダが現れて、その中に、xmlと画像のWEBページのような構成になっているではありませんか!!

今までこの事実を知らなかったんですが、これって当たり前の事なんですか???

操作手順

とりあえず、なんとなく便利に使えるかも・・・というレベルですが、手順をメモっておきます。
1.Wordで普通にファイルを作ります。
image08

2.「docx」ファイルとして保存します。
image10

3.拡張子を変更します。「.docx」→「.zip」
image09

4.zipファイルを解凍します。
image12

5.解凍されたデータ
image14

中に保存されている画像データを取り出す時など便利ですね。
いっその事、xmlではなく、htmlも保存してくれていれば、Web管理としても使えるのに・・・と思ったのですが調べてみたら、xmlにしたのはオープン性を獲得する為だったのですね。

近年ではオープンソースの無償オフィススイートである OpenOffice.org や、 Microsoft Office との互換性をさらに高めた実質的な後継ソフトの LibreOffice が政府系機関や地方公共団体などを中心にシェアを奪いつつあり、マイクロソフトは Office 2007 からオープンなファイル形式を採用するなどして対抗しているが、オープンフォーマットを標準とする無料のオフィススイートがある中、対価を払ってまで Microsoft Office を購入する必要があるのかという意見もある(Wikipediaより)

他のアプリでも試してみた

Excel

image15

PowerPoint

image11

素晴らしい!どの形式でも、zipファイルとして、解凍ができて、中にデータが保持されていますね。

何ができるか発想してみた

もしかすると、この逆を考えるのであれば、このファイル構成をしてzip圧縮すれば、WEBシステムから、その構成でのWordファイルやExcelファイルなどの出力が安易に行えそうですね。

自社サービスでのレポート機能などで流用できそうです。

今頃この仕様に気がつくなんて、僕はなんて遅れているんだろう・・・

© Microsoft

コメント