微博 微信

Hao4K影音

[技术教程] 14C-整改字幕流程f_自定UTF-8字幕试行规范

2021-7-21 02:56:13 2535 0 |只看大图 回帖奖励 |倒序浏览 |阅读模式

Yuran 帖主

2021-7-21 02:56:13

14C,其中的14, 是连载篇的序号。后缀C,意指 三板斧的第三斧(与 ass外挂字幕的、DIY 实验有关)。8 {5 Y* N. V/ `2 @7 b6 Q- `
本人原创实验心得,非专业,非权威。谨供参考。全部归纳/整理到:论坛淘帖专栏中,链接在此$ ~: r/ V! W' ?9 [

% Y+ B7 Q0 _* O  v8 S) g
" |/ p! D( n- P& D7 m
0 p) U9 V: Y! _# j3 v! l/ Y这是我的自习笔记,兼做备忘录。
* x6 W! Z1 ]# K+ Y3 E9 G% M外挂字幕的、整改前的前期(预备)工作,目前来说,Yuran 通过DIY编程、整合,已能实现,下述功能:
% X1 M; y  A) h; `  \. Y& b) k1 h  O7 `8 M+ e2 ]
  • 自动判别外挂字幕,究竟是ANSI类,还是Unicode类。
  • 对于ANSI类的字幕,能自动甄别:中(简繁)日韩、英文语种。
  • 对于Unicode类的字幕,能自动判别、区分:带BOM的UTF-8、不带BOM的UTF-8 !
    - x5 D0 o/ \2 A- o

: B& v1 p+ `& w0 X, L* f1 ^0 S, J! a/ z/ }& h
2 V: h$ q/ r* I8 r1 k
* {5 N6 {* Q! `
: _* J  l1 n0 i  O

( K0 o$ z& m3 t: Z* l( {' m
* g* x+ I. q- ?  O2 J" i; r8 z! k后续工作,也没问题,已编程、通过测试。- A* ^* _" t4 X+ }1 G! n

: t# X; R( Q; E# `) v% ?6 B
  • 能将多语种的ANSI字幕,分别自动转码,改成 Unicode的(UTF-8 ,或 UTF-8 带 BOM)!
  • 能将不带BOM的UTF-8 字幕,自动转成: 带BOM的UTF-8 !& b0 t; r1 e5 E3 {' Y# N3 q

2 V) a+ D& C! o; y' L! b# e8 ^+ u3 S4 M

( f' r' h) A$ X3 X7 R 现如今,Yuran所制定的、家庭影院看片用的、(外挂)字幕编码规范,' b, Y, Q$ W0 k# v6 n2 i& M
究竟是采用:带BOM的 UTF-8 ,还是不带BOM 的UTF-8 呢?
0 w' O/ h6 }* c% U! q; K& O% J) X/ z& F5 q' i$ c
目前来说,我决定: 以普通的 UTF-8 (也就是,不带BOM),作为试行规范!  H" z1 ]9 o6 ~* ^

" p% t+ b% \( n- n! N) D+ z+ W1 q给 UTF-8 加上 BOM,那是微软的风格。而 Unix 、Linux等平台的开发者,并未跟风。8 _& z! `" h4 e- X
因此,存档的相关文件,也必须要有: 向下兼容、跨平台的考量!- w" f. c% W& M% H
(再者说,HTML有charset,XML有encoding,都有文字的编码规范。7 q3 d' P  S( F. Z2 ?% |
而带BOM的UTF-8文件,在其它平台读取、编译时,可能有麻烦!); c5 U. U/ M2 e' o/ p
, b  x* A) U' P# ^8 w

; _2 `. P9 C7 D; S- j; w$ c) U$ z) ^5 }7 M; F/ `
再论家庭影院,自己积攒的片源、所配套的外挂字幕等,难道是:微软的系统/环境专用?!
/ J6 H0 r: \0 k! P- r别忘了,许多4K 硬盘播放器的底层软件,都是基于Linux、安卓等系统。
6 d+ m+ n) W5 Y, W, p
. r' @0 b5 O4 i2 w2 h6 r* J! K
我这里,即使 杰科 G5300, 支持Unicode字幕。 但不同房间、不同住所,还有芝杜、海美迪等播放器呢。
6 L* |. b% k4 \: }因此,为了规避风险、消除隐患。不妨这样:
' S, [, m- g( f) j4 c) O% w
+ O; q2 T6 U. V6 C9 |8 `" ?
  • 暂时将ANSI字幕的、转码规格,定在 UTF-8 (不带BOM)。
  • 网络下载的、Unicode的、不带BOM的UTF-8 字幕,不做转码。0 p" h& ?: D, @/ h. }2 c
  • 网络下载的、Unicode的、UTF-8 且带BOM的字幕,不做转码。7 r/ g! S7 P/ j5 R0 `( A

, C! \. ]9 z0 ]$ m7 m+ h4 f* _
这样做,并非堵死那个“BOM”,慢慢过渡吧(据传,linux也在改良,开始支持UTF的BOM)...
: p" x; l- {: p2 ~" ^2 P) X! I
( I( f4 P5 e/ P8 }
0 K$ C4 W% L- p! a0 `$ |# z' R) ?2 G# }% p
等将来,如果迫于需要,须强制使用: 带BOM的UTF-8 字幕时,用程序做批量处理,( z9 ]7 \. j7 Q) V1 C! v( B
将普通UTF-8字幕,分别加上:三个字节的(BOM)Header,这不难。
. ~  N; U7 \; N  O7 a$ L自己编程、或借用第三方工具,都能轻松实现。
0 G$ G$ A( c2 N* E& J! g4 P, k0 M+ D2 ?
yyy.jpg 1 Y, U# Y0 E  R* o# o: ?

" a0 y+ M: j% v# _/ k$ ]反正吧,UTF-8字幕,若不带BOM,随时可以:加上Header 。
7 ?4 Z% J" ]% ^) {% L

免费评分

参与人数 1活跃 +1 H币 +8 收起 理由
流年似春水 + 1 + 8 很给力!

查看全部评分

本帖被以下淘专辑推荐:

回复

使用道具 举报

   发表回复

您需要登录后才可以回帖 登录 | 立即注册

返回列表 本版积分规则

:
白银玩家
:
未填写

主题

帖子

积分2003

  • 在线客服

  • 返回顶部