<center id="r3vq0"><ol id="r3vq0"></ol></center>

  1. <tr id="r3vq0"><sup id="r3vq0"><mark id="r3vq0"></mark></sup></tr><strike id="r3vq0"><menu id="r3vq0"></menu></strike>
  2. <big id="r3vq0"><s id="r3vq0"></s></big>

      <tr id="r3vq0"></tr>
      <big id="r3vq0"><s id="r3vq0"></s></big>
      • 用戶(hù)名
      • 密碼
      • 產(chǎn)品
      供應
      求購
      公司
      資訊
      展會(huì )
      評論訪(fǎng)談專(zhuān)題話(huà)題印搜動(dòng)態(tài)
      國內國際環(huán)保視頻產(chǎn)品導購
      活動(dòng)展會(huì )設備印品世界
      行業(yè)動(dòng)態(tài)企業(yè)動(dòng)態(tài)營(yíng)銷(xiāo)電子商務(wù)政策法規統計商機
      印前印中印后包裝器材耗材油墨
      膠印數碼標簽CTP紙箱創(chuàng )意絲印柔印其他
      展會(huì )專(zhuān)題企業(yè)專(zhuān)題資訊專(zhuān)題技術(shù)專(zhuān)題
      文化人物社會(huì )
      展會(huì )預告會(huì )議預告展會(huì )資訊國內展會(huì )國際展會(huì )推薦展會(huì )
      印刷包裝絲印
      印刷包裝絲印
      印刷包裝絲印
      您當前位置: CPP114首頁(yè)> 新聞頻道> 國內> 正文

      • 今日排行
      • 本周排行
      • 本月排行

      膠印油墨
      膠印材料
      絲印材料

      電子書(shū)亟待高質(zhì)量轉檔

      2012-08-17 09:41 來(lái)源:中國新聞出版報 責編:陳培

      摘要:
      電子書(shū)是校對者的噩夢(mèng),每當需要將PDF文件轉化為epub格式時(shí),那些原本完美顯示的頁(yè)面就會(huì )出現一系列令人困惑的排版和格式錯誤。對于出版商和內容供應商來(lái)說(shuō),在電子書(shū)如此暢銷(xiāo)的今天,能夠使PDF文件準確無(wú)誤地轉化為epub格式,從而存入電子書(shū)閱讀器已經(jīng)成為亟須關(guān)注、亟待解決的問(wèn)題。
        【CPP114】訊:電子書(shū)是校對者的噩夢(mèng),每當需要將PDF文件轉化為epub格式時(shí),那些原本完美顯示的頁(yè)面就會(huì )出現一系列令人困惑的排版和格式錯誤。對于出版商和內容供應商來(lái)說(shuō),在電子書(shū)如此暢銷(xiāo)的今天,能夠使PDF文件準確無(wú)誤地轉化為epub格式,從而存入電子書(shū)閱讀器已經(jīng)成為亟須關(guān)注、亟待解決的問(wèn)題。

        “有人認為轉換PDF格式就像從word文檔里復制文本一樣簡(jiǎn)單:只需要選取那些已編好格式的文本并保存就能制作一本電子書(shū)。”印度金奈紐貞知識機構的首席執行官大衛·拉杰說(shuō)。然而,遺憾的是,“PDF文件并不是按照單詞、空格、段落和圖像的邏輯流程來(lái)編寫(xiě)的,也就是說(shuō),沒(méi)有內在信息可以顯示PDF文本的結構與順序。”

        最嚴重且最常出現在電子書(shū)中的錯誤是單詞間、標點(diǎn)符號丟失或多余的空格。因為PDF文件并沒(méi)有把每一個(gè)單詞視作被空格分開(kāi)的獨立單元,轉換程序通常需要猜測空格從哪里產(chǎn)生。如果猜測錯誤,就會(huì )出現一個(gè)單詞被分為兩個(gè)部分或者兩個(gè)單詞連在一起的情況。

        另一個(gè)問(wèn)題存在于連字符中。只要轉換軟件需要判定連字符是非強制性的(在文本行末尾,由于該單詞過(guò)長(cháng),輸入連字符使頁(yè)面保持整齊美觀(guān))或強制性的(比如像“e-books”這樣必須使用連字符的單詞),那么就可能出現判定錯誤的情況。

        同樣的問(wèn)題還存在于判定文本格式上:粗體、斜體、下劃線(xiàn)、下標、上標;字體的選擇上:有襯線(xiàn)字體、無(wú)襯線(xiàn)字體、傳統字體、現代字體等。在制作PDF文件中字間距、行間距的設置,反白字的使用都會(huì )影響轉換結果的準確性。

        如果作者沒(méi)有使用統一編碼標準的字符,那么這些特殊字符比如非拉丁語(yǔ)字母就成了轉換軟件面臨的又一個(gè)困難。對于這些特殊符號而言,建立字符轉換庫是有用的,但是把所有可能出現的字符集結成庫并不現實(shí),所以大多數轉換軟件在遇到特殊字符時(shí)會(huì )以亂碼的形式呈現。

        此外PDF文件還不能識別多列文本。轉換軟件會(huì )讀取整個(gè)頁(yè)面而不是按順序從上到下依次讀取每一列的內容,因此,識別與分列就會(huì )導致不同的列線(xiàn)混亂,從而產(chǎn)生完全錯誤的顯示。

        與此相似的是,PDF文件沒(méi)有強制性分隔段落的概念,這就增加了正文內容混亂或幾個(gè)段落連在一起的可能性。另一種情況是,轉換后段落中的每一行都成為獨立的一段,或者是轉換程序會(huì )將頁(yè)面中的頁(yè)眉、頁(yè)腳作為正文中的內容進(jìn)行轉換。

        轉換程序最大的挑戰在于如何破解表格、數學(xué)方程式以及圖表。將這些元素識別為獨立的單元并與正文分開(kāi)成為許多轉換軟件不能完成的任務(wù)。

        在紐貞知識機構,有一種使用自然語(yǔ)言處理和文本識別工具的程序,這種程序用來(lái)分析PDF文件文本結構,使用這種程序可以改正PDF文件轉換為epub格式過(guò)程中通常出現的錯誤。如今這種產(chǎn)品已經(jīng)出現——在紐約舉辦的2012TOC數字出版大會(huì )上,可以將PDF文件高質(zhì)量轉換為epub2或3的產(chǎn)品“絲綢”(意為像絲綢一樣流暢光滑)閃亮登場(chǎng)。

        據介紹,使用“絲綢”的轉換規則系統可以得到高質(zhì)量的結果,同時(shí)最大限度保持PDF文件原文的風(fēng)貌。“絲綢”會(huì )運行拼寫(xiě)檢查工具找出連在一起或被分解的單詞,并使用內在連續性檢查工具區分字符。不到一分鐘的時(shí)間,“絲綢”就可以對一本標準的300頁(yè)圖書(shū)完成以上所有工作。接下來(lái),“絲綢”會(huì )引導用戶(hù)查看它標記的每一處可能出現的錯誤,并將原始的PDF文件與轉化后的電子書(shū)進(jìn)行并排式對比。拉杰同時(shí)補充說(shuō):“‘絲綢’直觀(guān)的界面意味著(zhù)用戶(hù)不需要精通HTML編輯也可以熟練地控制與使用這些功能。腳本處理選項可以快速有效地將PDF文件中出現的自定義或其他復雜的變化轉換為epub/HTML文件。”

        目前,“絲綢”正在進(jìn)行內部測試,拉杰證實(shí)這種軟件運營(yíng)服務(wù)模式很快會(huì )與廣大客戶(hù)見(jiàn)面。在更為復雜的PDF文件與電子書(shū)版面設計問(wèn)世之前,我們無(wú)疑需要更先進(jìn)的解決方法,將零錯誤的電子書(shū)和用戶(hù)對電子書(shū)質(zhì)量的高滿(mǎn)意度作為奮斗目標,將驅使轉換工具研發(fā)朝著(zhù)更快、更可靠、更自動(dòng)化的方向發(fā)展。
      • 【我要印】印刷廠(chǎng)與需方印務(wù)對接,海量印刷訂單供您任意選擇。
      • 【cpp114】印刷機械、零配件供求信息對接,讓客戶(hù)方便找到您。
      • 【我的耗材】采購低于市場(chǎng)價(jià)5%-20%的印刷耗材,為您節省成本。
      • 【印東印西】全國領(lǐng)先的印刷品網(wǎng)上采購商城,讓印刷不花錢(qián)。
      天天操天天添天天插 久久久久综合日本亚洲 五月99久久婷婷国产综合亚洲 国产精品视频免费一区二区

        <center id="r3vq0"><ol id="r3vq0"></ol></center>

      1. <tr id="r3vq0"><sup id="r3vq0"><mark id="r3vq0"></mark></sup></tr><strike id="r3vq0"><menu id="r3vq0"></menu></strike>
      2. <big id="r3vq0"><s id="r3vq0"></s></big>

          <tr id="r3vq0"></tr>
          <big id="r3vq0"><s id="r3vq0"></s></big>