微博 微信

Hao4K影音

[交流分享] DIY实验15C-应对家庭影院片源的三板斧-连载:自动整改字幕流程7_甄别多语种的ANSI字幕

4 天前 2202 1 回帖奖励 |倒序浏览 |阅读模式

Yuran 帖主

4 天前

前篇已讲:
- G$ u0 I1 u. p9 d& M; O  F
9 x$ K& n( u' |# j! V1 l
  • Yuran自定的规矩,网络下载的、UTF-8 字幕,区分BOM特征后,仅作记录,但不再转码。
  • 而ANSI类的、多语种字幕,则一律转码,改成 普通UTF-8 的规格(不带BOM)。/ `' M7 t, x9 n, O; G- k

* l+ v2 `: s) ~. L3 X9 Q与ANSI字幕相关的(DIY)编程,在读取字幕前,必须要检索、甄别、切换各语种的 Code page ,避免乱码。0 J* H# ^8 t+ p  C1 `" x
! _0 }" p" P7 }4 F9 f% \

/ P3 ?9 E' ^" v3 p& x' D" N
5 F8 V7 v6 k1 e; n* |2 R2 P. Y7 K既然,已有 EncodingChecker 2.0 的测试报告。
7 L( o5 I0 [$ l* f4 ?( y' s

) ?3 M  L; y2 v* `$ ]
8 u. D# i3 i0 Z" I# R3 [+ z- J1 I4 w; d* `
那就好办了。# o3 N6 b3 E* C1 I
读取实验报告,逐行检索!: z' a5 z3 |5 f* M( H

! `8 M  t1 ?& y) I5 y
  • 但凡遇到: UTF-8  的特征字,直接略过。
  • 不带 UTF-8 字样的、均属ANSI类的范畴,需做处理!
  • 中(简繁)日韩编码规格的,需要分配Code Page,再去读取字幕。
  • 英文字符,均被兼容。可以不做处理。
    ( h9 i* U# J- B! }9 ^
, q1 H, H# T( @3 F% O' H
( v  ^$ P5 d" {* y' |( }
. |! k, o7 P; D! i/ {( e) p
捕77获.jpg
( W$ \/ t% U! n: W; s( A5 |
/ w; ?/ i1 u1 m: ^% ^4 A如此这般的设计,看似复杂。实际上,不难,效率也很高。
! T4 Q4 m% p/ `3 E5 {# v; n4 U现如今,如日中天的软硬件配置,高效的处理能力,做这些工作,都是小菜一碟...: z0 p: G3 \" [1 F9 S0 F& C
下篇接着讲: 由ANSI,到 Unicode 字幕的(实战)转换。
" s1 C6 D0 w. h2 V' e4 R* d5 d& ]% P

免费评分

参与人数 1活跃 +1 H币 +8 收起 理由
流年似春水 + 1 + 8 赞一个!

查看全部评分

本帖被以下淘专辑推荐:

回复

使用道具 举报

全部回复1

imagay 发表于 4 天前

imagay 2

4 天前

这个好,可以较深入的理解一些知识
回复 支持 反对

使用道具 举报

   发表回复

您需要登录后才可以回帖 登录 | 立即注册

返回列表 本版积分规则

:
白银玩家
:
未填写

主题

帖子

积分1988

  • 在线客服

  • 返回顶部