APP下载 微博 微信

Hao4K影音


[软件相关] 10C-整改字幕流程b_字幕规格的演变历程

[复制链接]

发表于 2021年07月19日 04:52 10608 1 来源:影视制作> 软件相关 |只看大图 回帖奖励 |倒序浏览 |

Yuran 帖主

2021-7-19 04:52

10C,其中的10, 是连载篇的序号。后缀C,意指 三板斧的第三斧(与 ass外挂字幕的、DIY 实验有关)。
本人原创实验心得,非专业,非权威。谨供参考。全部归纳/整理到:论坛淘帖专栏中,链接在此



  这是本人自习/归纳的备忘录,便于随时随地的复习/重温(否则,知识爆炸的冲击,记不住)!

  前一篇说到,网络下载的字幕,解决了音唇同步的时间问题(提前32秒)。 接着转存,获得 ass 的格式。
也就是 0000.ass (必须改名,下载的字幕,还有非法字符,给程序检索带来隐患)。

但还有一项流程,必须确切落实! 那就是,双语字幕的、文本文件的编码格式,需要自动识别,以及转码!



  以前我讲过,所有的一切,是为了家庭影院的影音器材,而不是PC!
(用PC看片,仅仅是验片、制片阶段的过渡期。毕竟,PC显示器,仅支持HDR,但很难做到杜比视界的规格。
再者说,7.2.6声道的、全景声音效,也不是为PC布置的)。

因此,Yuran所整改的字幕,必须针对家庭影院的影音器材(比如:杰科的G5300) ,做针对性的改良/优化。
杰科G5300 4K播放机,具备下述功能!

  • 越狱升级的机器目前支持最常用的文本字幕格式 :*.srt,*.ass,*.ssa
  • 支持外挂字幕的大小、位移、时移、颜色等特效调整洁,同样支持 ASS 字幕几乎全部特效指令参数;
  • 支持同一部电影支持多达 32 条不同字幕切换;)
  • 字幕文件名字不需要与电影名字一样;
  • ANSI、UNICODE、UTF8、BIG5 自动识别;
  • 支持普通 2D 字幕,切换左右 3D 格式;
  • 支持更换字幕显示字体。

但为全局考虑,Yuran这里的字幕,都必须采用:同一个标准,那就是 UTF-8  !!
也许,我的考量,有些瑕疵。实践中检验、逐渐改良吧...



ANSI?!虽是扩展的ASCII字符编码,但太旧了。许多老版本的集成开发环境,才会用:ANSI编码,但已过时!
而且,ANSI的兼容性也不是很好。多国语言的字符应用中,会有乱码的串扰。
我国最开始,公布的是: GB2312 (能与ASCII兼容),但也有短板:
在人名、古汉语等方面,所出现的罕用字,GB 2312无解。

因此,又有 GBK(拓展生僻字)、以及 GB 18030(增加少数民族字体)等汉字字符集的出现。



实质性的革新,是Unicode(把所有语言,都统一到一套编码里,解决了乱码问题) 。
Yuran找到的、希伯来文的srt字幕(ANSI编码格式),用Win10 记事本打开,乱码!

aaa.jpg

再用Win10 记事本,打开另外一个、Unicode(UTF-8编码)srt同名字幕 ,完美显示(希伯来文)!

uuu.jpg

用记事本,查看字幕, Unicode( UTF-8)模式 ,相对方便一些(无需调整编码规范,可谓:所见即所得)!
再举例:未做任何改动,就用记事本,分别打开

  • Unicode(UTF-8 , 带BOM) 的韩文字幕;
  • ANSI的日文字幕;

ccc.jpg

事已至此,选哪种,作为整齐划一的规范?     不言自明了吧...

(我这里,多年前的旧机器,oppo BDP-93 还是 95 ?限于当时的条件,只能用ANSI的...
现如今,今非昔比! 杰科的 G5300 ,完美支持 Unicode 字幕(UTF-8 、或 UTF-8 带 BOM)!



但是,起初的Unicode编码,有些浪费。
假设字幕中,英文字符占大多数,用Unicode编码,就比ASCII多一倍的存储空间。不利于存储和传输!

最实惠的、Unicode字符集的编码(精简)方案,当然是UTF-8 了(可以上网查询),提高了传输效率。

090.png

而且,向下兼容!(旧的 ASCII编码,实际上可以被看成:是UTF-8编码的一部分。 好处是:
大量只支持ASCII编码的、历史遗留的软件,仍然可以,在UTF-8编码的环境下、继续工作...)

实际案例:
现如今的、网页制作、外挂字幕等制作时,无论是计算机的内存,还是网络服务器,都采用Unicode 。
只是在保存文件,或传输到网络浏览器时,全都转码,实行UTF-8的标准!

因此,在Yuran这里,为家庭影院所“内定”的、字幕的编码标准,是中规中矩的 UTF-8  。
(何为“中规中矩”? 去网上,搜寻、下载双语ass字幕,大多都是:UTF-8 的... )



万一搞到的外挂字幕,是ANSI的呢?

很有意思,这回实验用的(前篇所介绍的)srt字幕,恰恰是 ANSI 的。
(人工)识别、转换,也不难, Windows的记事本、还有UltraEdit ,都能搞定!

ansi0000.jpg

用鼠标点击上下图,都能看到:原文件(0000.ass)的编码格式,ASNI (GBK)。

ansi0001.jpg

若想 【另存为】其它文件名时,可以更改、转换编码格式(ANSI、UTF-8、带BOM的UTF-8、UTF-16等)...



即使是UTF-8,也分为:

  • 带 BOM的UTF-8 ;
  • 不带BOM 的UTF-8;

Yuran目前的选择,应该是:不带 BOM 的 UTF-8 (规避兼容性方面的问题)!



问题在于,我们要面对的、可能是成百上千的UHD BD片源,相应的外挂字幕,也得一一对应。
总不能,人工检索、转码吧。

于是,艰巨的任务,摆在面前。 如何见招拆招,使用DIY编程的手段,实现字幕甄别、转码的自动化?下篇再讲。

延伸阅读
应对家庭影院UHD片源的三板斧-连载前言
https://www.hao4k.cn/thread-59303-1-1.html

2C-ass字幕脚本内:4K HDR外挂字幕调色
https://www.hao4k.cn/thread-59325-1-1.html

3C-ass字幕脚本中:HDR外挂双语字幕调色
https://www.hao4k.cn/thread-59342-1-1.html

4C-ass字幕脚本中:SDR外挂字幕边缘配色
https://www.hao4k.cn/thread-59357-1-1.html

5C-ass字幕脚本里:HDR外挂字幕边缘配色
https://www.hao4k.cn/thread-59387-1-1.html

6C-用杰科G5300播放机做字幕相关的实验
https://www.hao4k.cn/thread-59405-1-1.html

7C-ass字幕脚本中的、与色域有关的新定义
https://www.hao4k.cn/thread-59408-1-1.html

8C-分享Yuran自定义的、ass字幕的实验模板
https://www.hao4k.cn/thread-59444-1-1.html

9C-整改字幕流程a_为音唇同步,调整时间轴
https://www.hao4k.cn/thread-59484-1-1.html

10C-整改字幕流程b_字幕规格的演变历程
https://www.hao4k.cn/thread-59566-1-1.html

11C-整改字幕流程c_形态各异的实验字幕样本
https://www.hao4k.cn/thread-59600-1-1.html

12C-整改字幕流程d_可借用的第三方小程序
https://www.hao4k.cn/thread-59661-1-1.html

13C-整改字幕流程e_UTF-8字幕BOM特征码
https://www.hao4k.cn/thread-59716-1-1.html

14C-整改字幕流程f_自定UTF-8字幕试行规范
https://www.hao4k.cn/thread-59717-1-1.html

15C-整改字幕流程g_批量甄别外语ANSI字幕
https://www.hao4k.cn/thread-59718-1-1.html

16C-整改字幕流程h_转换后UTF-8字幕无乱码
https://www.hao4k.cn/thread-59720-1-1.html

17C-整改字幕流程i_提高UTF字幕的甄别效率
https://www.hao4k.cn/thread-59784-1-1.html

18C-整改字幕流程j_ANSI(外语)字幕批量转换
https://www.hao4k.cn/thread-59798-1-1.html

19C-整改字幕流程k_UTF-8字幕移除BOM
https://www.hao4k.cn/thread-59819-1-1.html

20C-整改字幕流程l_将外来ass转成规范的ass
https://www.hao4k.cn/thread-59881-1-1.html

21C-整改字幕流程m_ass文件,不只是字幕
https://www.hao4k.cn/thread-59882-1-1.html

22C-想实现字幕自动下载/归档,须与时俱进
https://www.hao4k.cn/thread-60028-1-1.html

本帖被以下淘专辑推荐:

回复

使用道具 举报

全部回复1

imagay 2

2021-7-19 07:36

提供了一个不错的思路
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

返回列表 本版积分规则



绑定微信 + 关注公众号,第一时间获得消息通知!
:
版主
:
介绍未填写

主题

帖子

积分3639

Hao4K影音app客户端下载