??xml version="1.0" encoding="utf-8" standalone="yes"?>
JavaeijavawebhtahtapdfH2PH2PxmlH2PH2PpdfxslH2PRSSSEOemailH2PH2PH2PH2P2009912Q博士招生考试的时间已l(f)q,我必d力以赴的复习(fn)?jin),q是很幸q,我现在已l在上博?jin),|站依然没有旉更新Q而且现在正在忙着准备参加今年?/span>blog trackqq38295305emalyangjinfeng2010@gmail.com
H2pҎ(gu)扚wURLpdfH2ph2p-fileh2p-toolh2p-filexmlxmlurlurlh2p-toolh2p-filepdfxslurlh2pH2pH2P倡议——一U新的互联网应用模式
感兴的同仁能加盟?/span>
不局限于Java?/span>ruby?/span>scala的进一步发展和壮大Q诚邀(g)Ҏ(gu)目标感兴的同仁Q一h发展JavaEI感兴的同仁Q也Ƣ迎与我们联p,
Q?/span>
Q?/span> |站的管理员Q近D|_(d)我站提出h2p应用?/span>h2p的意思,具体地说是根据批?/span>URL文档的解x(chng)案,该方案是一个完整的解决Ҏ(gu)。我觉得h2p|站的媄(jing)响力有限Q推q力度不够,Z(jin)能让h2p在技术上微不道Q重要意义体现在应用模式上。就?/span>Rss本n技术上没什么可说的Q但应用模式上意义重大,rss也能?/span>rss下面从三个方面来展开Q?/span>h2pQ?/span>h2p一?/span>H2P?/span>javaei包括两个部分Q?/span>h2p-file?/span>h2p-file文gQ用来描q批量的URL的先后顺序和层次l构Q用于处理书{)(j)?/span>h2p-tool校验h2p-file和根?/span>h2p-file文档?/span> Q?/span>h2p-file 包括两个xml?/span>outline.h2p.xmlhref.h2p.xml 1 <href-info> 很简单,之所以这hqͼ是因?/span>URL而这个符号不能出现在xmlQ所以就作ؓ(f)一个节点了(jin)?/span> h2p-tool生成的每?/span>pdf文g的名字取id?/span> outline.h2p.xml 1 <book name="我的PDF?> 描述?jin)每?/span>pdf的值和上一?/span>xml值对应,chapter的值就是书{名称?/span>H2p-tool把每?/span>pdfQƈ生成书签?/span> 的发展,完全有理由把q两?/span>xml文gQ可以定义成如下格式Q?/span> 对应?/span>dtd可以定义如下 h十分重要的意义,它作ZU资源被提供下蝲Q也可以在线使用Q?/span>h2p-fileQ?/span>h2p-tool h2p-tool的客L(fng)工具Q目?/span>h2p-tool校验h2p-file~辑功能包括新徏、修攏V保存, 生成有书{pdf一部分是用C#开发的。不?/span>h2p-tool卛_?/span> h2p-toolQ解?/span>h2p-fileQ,也可以不需?/span>h2p-tool展示h2p-file下图?/span>h2ppdf H2P 有什么h(hun)倹{自从有?/span>h2p(1)的风行,导出pdf导出功能的网站还?sh)多Q实际上技术已很成熟,原因在于没有很好的模式。导?/span>pdfQ而且在服务器端生?/span>pdf下蝲Q由用户利用W三方工P也即h2p-toolQ自行生?/span>pdfQ用户可以根据自q需要对h2p-file既满了(jin)个性需?/span>的压力{UM(jin)用户Q?strong>如果|站x(chng)?/strong>pdfQ就?/span>rssp Q网站可以根据用L(fng)h动态的生成h2p-file的功?/span>Q网站提?/span>h2p-fileQ满了(jin)用户的便P是赢利的开始。关于盈利,在网站广告投放这斚w一炚w不会(x)受媄(jing)响,pdf里可以适当放一些广告链接,同时Q?/span>h2p-tool在生?/span>pdf文g?/span>是只ȝ?/span> Q最后一点,是意义上的而非价g的,那就是如?/span>h2p?/span>blog?/span>twitter{等Q耳熟能详的东西,有技术含量吗Q真正有价值的是这些应用模式,正是q些应用模式推动着互联|的飞速发展。而搜索引擎却集优U的应用模式和先进的理论思想与技术于一w?/span> Q有可能带来其他斚w的媄(jing)响,比如|站内容的提炼和聚合?/span> H2PH2PQ齐?j)协力共同制定和完?/span>h2p-file应用更加便捷和丰富?/span>h2p-fileQ确定了(jin)h2p-fileQ?/span>h2p-tool开发方面已l有?/span>JDIC的方向,在线解析h2p-file昄h2p-fileQ博克文章、论坛帖子一般至有三分之一的内Ҏ(gu)q告或图片,直接Ҏ(gu)URL显得很臃肿Q这是这个方案的~陷Q解册个问题最单的思\是|站针对h2pQ根据这?/span>URL质量q个概念Q图片越广告越,那么生成?/span>pdf质量p高;反之Q生成的pdf质量p低?/span> Q如果上面的思\得到?jin)采UI那么Ҏ(gu)一?/span>URL的技术就能很好的解决。目前的h2p-toollgQ生成的pdf览器的功能Q。之所以采用这个组Ӟ是因保证生成?/span>pdf应用再提供一?/span>URL得到的内容主要是文字形式的内容,没有复杂的标{֒样式Q这U情况下Q?/span>iText是可行的?/span>Javaeye下蝲和电(sh)字书制作得到?/span>pdf?/span> Q各|站?/span>h2p卛_Q?/span>h2p-file应用模式?/span>h2p完善和发展的方向Q回{了(jin)Z么要发vq个h2p应用Q不仅会(x)各网站带来新的赢利,而且q将是我们这些中国程序员的集体荣耀?br />
H2P生成有书{PDFpdfQ之H2PpdfQ之H2P Q用根?/span>dtdQ?/span>h2p需要解?/span>xml文gQ提?/span>urlq合qӞ不合法的xmlQ所以必dxmlQ?/span>xmlQ用JTree的树(wi)形结构,q一部分用的?/span>domQ,获取书签的目录结构ƈ构徏书签的数据结构,q一部分用的?/span>SAX。保?/span>xml?/span> Q?/span>swing~辑功能用的?/span>swingQ?/span>5lgQ根?/span>urlQ用的是c#开发^Cq行?jin)简单的开发?/span>Javaei文gQ单每?/span>url也需要一Ҏ(gu)_(d)何况是几十条Q所以运用多U程是必ȝ方式Q研I了(jin)一?/span>c#的多U程方式也很有意思,感觉?/span>java?/span>c#Q?/span>iText面以及(qing)合ƈpdf。在合ƈ的时候,也研I过另一个框架就?/span>pdfbox实强?zhn)Q理ZQ应?/span>iText在生成书{这一块,做得相当漂亮Q书{֏以指向Q意一个页面的L部分Q还可以讄书签对应面的打开效果Q对书签的开发也很便利,直接构造书{?wi)Ş数据l构我认为是最单的Q?/span>iText描述书签的结构?/span> Q?/span>Classloader的运行依赖于很多?/span>jar包放在指定的目录Q应用服务器?x)去加蝲依赖?/span>jar中,需要自己处?/span>jar环境变量以外的变量。所以解?/span>jarҎ(gu)的类Q所?/span>jar文g里写?/span>jar中,对类加蝲q行?jin)改写,使其自动加蝲指定目录下?/span>jarQ?/span>jvm很多Q再合ƈ的时候会(x)占用大量内存Q很Ҏ(gu)out of memery参数Q主要是两个Q?/span>-Xmx512m -Xms512m h2p-toolJDOmiTextj2seH2p-tool Q详l描qC(jin)解决Ҏ(gu)的思\Q?/span> Q提Z(jin)一U描q?/span>URL文gQ称之ؓ(f)h2pQ根?/span>h2p文档的工L(fng)?/span>h2p-toolq能?/span>h2p?sh)子书?/span> Q?/span>h2p是gҎ(gu)费力的事情,所以该解决Ҏ(gu)q提供了(jin)下蝲h2pH2p格式Q我U下里是希望q种格式能够被大家接受,所以我定义?/span>dtd文g的工?/span>h2p-tool|站上提供了(jin)大量?/span>h2pQ制作自qpdf为大家所接受Q?/span>h2p应用q是很简单很原始。主要表现在Q生成的pdf的完全再玎ͼq是他的优点也是他的q?/span> 的呈现效果和在浏览器里风g栗?/span> Q我们希?/span>pdf里?/span> Q制定一U规范,该规范要求网站ؓ(f)每篇博客提供一个ؓ(f)h2p链接吧)(j)Q根据这个链接打开的博客文章是没有q告的,那么h2p链接Q生成的pdf链接Q很多h会(x)之点?/span>h2pQ第二种可能的展望就是,各网站提供一?/span>webservice文档Q显?dng)要实现这两个展望是很困难的,除非大家都很接?/span>h2p的普?qing),那也是一波三折,最l还是因为其便捷的用模式而被大家所接受?/span> 的?/span>
阅读全文
2 <href id="KxgYaRxG">
3 <value><![CDATA[http;//www.163.com]]></value>
4 </href>
5 <href id="53Bw5A32">
6 <value><![CDATA[http://www.sohu.com]]></value>
7 </href>
8 <href id="eyEis6ra">
9 <value><![CDATA[http;//news.163.com]]></value>
10 </href>
11 <href id="DMQoSN2t">
12 <value><![CDATA[http;//sports.163.com]]></value>
13 </href>
14 <href id="5vaf3LN7">
15 <value><![CDATA[http://news.sohu.com]]></value>
16 </href>
17 </href-info>
18
2 <chapter name="163" href="KxgYaRxG">
3 <chapter name="163新闻" href="eyEis6ra" />
4 <chapter name="163体育" href="DMQoSN2t" />
5 </chapter>
6 <chapter name="sohu" href="53Bw5A32">
7 <chapter name="sohu新闻" href="5vaf3LN7" />
8 </chapter>
9 </book>
10
2 <chapter name="163">
3 <href><![CDATA[http://www.163.com]]></href>
4 <chapter name="163新闻">
5 <href><![CDATA[http://news.163.com]]></href>
6 </chapter>
7 <chapter name="163体育">
8 <href><![CDATA[http://sports.163.com]]></href>
9 </chapter>
10 </chapter>
11 <chapter name="sohu">
12 <href><![CDATA[http://www.sohu.com]]></href>
13 <chapter name="sohu新闻">
14 <href><![CDATA[http://news.sohu.com]]></href>
15 </chapter>
16 </chapter>
17 </book>
18
2 <!ATTLIST book name CDATA #REQUIRED>
3 <!ELEMENT chapter (chapter*)>
4 <!ATTLIST chapter name CDATA #REQUIRED>
5 <!ATTLIST chapter href CDATA #IMPLIED>
6
2009-8-7
Javaei相关介绍Q?br />
投票——你认ؓ(f)h2p实用?/a>