微博 微信

Hao4K影音

[技术教程] 23C-DIY编程实验时,中文/外文片名的管理

3 天前 2052 2 |只看大图 回帖奖励 |倒序浏览 |阅读模式

Yuran 帖主

2021-9-7 19:01:49

本人原创实验心得,非专业,非权威。谨供参考。全部归纳/整理到:论坛淘帖专栏中,链接在此
   业余时间,还得加班加点、挑灯夜战,潜心编程,特别辛苦。实在没空加好友/答疑。敬请谅解。



  这是我的自习日记。 给动手能力比较强的DIYER们,分享创作心得...
  前期连载篇中,已经说到,Yuran终于放弃了、三千多行的、低版软件的编程项目,转学高级语言编程。
毕竟,高级语言,能自主编程, 实现:从相关网页上,自动抓取实用信息,自动下载到本地硬盘的地步!

另外,高级语言功能强大、效率高,速度快。可谓得心应手!
Yuran不是程序员,所谓的、家庭影院片源管理、硬盘管理、字幕管理的相关编程,全都是自学、DIY实验!
现如今,有了一些成果!

  本篇讲的是,Yuran在考虑自主编程时,有关UHD BD 中文片名,与原始片名,自动更名前的、
片名管理上的一些思路和创意。抛砖引玉,给喜爱DIY编程的爱好者们,做参考...



  TMM( tinyMediaManager)刮削时,所产生的 nfo 文件,

捕3获.jpg

Yuran自主编程的软件,自动摘取最关键的三行!

  •   <title>寄生虫</title>
  •   <originaltitle> Parasite </originaltitle>
  •   <year>2019</year>

给片源文件夹更名时,就是这三行的信息,起了至关重要的作用。
这只是自定的、片源文件夹的更名规范。Yuran的自编程序,能自动‘拼接’,
将网上的资源,所下载的文件夹名:

Parasite.2019.KOREAN.2160p.BluRay.x264.8bit.SDR.DTS-HD.MA.TrueHD.7.1.Atmos-SWTYBLZ

自动更名为 :寄生虫_Parasite_2019

(至于其它的属性,比如视频轨、音频轨、语种、剧情归类等,另有解决方案,以后再讲)。
Yuran的想法就是,文件夹名,简短和精练!
十多个TB的硬盘,百多个片源文件夹,瞬间完成:自动更名(这是前期GIF动画演示、低级语言编程的实验结果)!



现如今,已改用:高新的编程语言,重新编程!其数据处理能力,更快更强!



根据Yuran自定的规则 :

  • title: 必须含中文字符(即使是阿拉伯数字,也得改成中文的,比如:二零一二)。
  • original title:必须含英文字符(阿拉伯数字、通常的符号等,也算数, 比如:2012)!
  • year:必须是十进制的阿拉伯数字!

如何在编程中,自动判断、落实上述规则呢?



第三个条件,不难,Unicode 编码,甄别年代的字符属性,限制在 0~9  ,就行了。



第一个(条件)呢?

  我是这样,设计的脚本: 首先,必须是Unicode的,最全的编码对照表,链接在此。
http://www.tamasoft.co.jp/en/general-info/unicode.html

CJK = Chinese-Japanese-Korean  ,
4E00-9FBF:是CJK 的、统一表意符号 (CJK Unified Ideographs)的常用汉字区域,用于【正则表达式】!

qaa.jpg

因此,所摘取的、  <title> XXX </title> 的字符串中,掐头去尾,再逐一甄别:
XXX中的每个字符,是否在:4E00-9FBF 的区域内(只要有一个字符达标,就可以认为,满足第一个条件了!)



至于 第二个条件,Yuran认为:有些电影的片名,夹带数字以及标点符号等,
因此,甄别时,在这个范围内的,都算正常!

捕a获.jpg

Unicode 字符表中的、(16进制的) 20H 到 85H内的字符,都算合法。



  新学的高级语言,DIY 设计的程序,越编越复杂,已经两千多行的脚本。
很好玩的。   乐此不彼的编程、最终的目标就是: 我可以什么都不干,让自编程序全包了!

  自家的片源管理,就得规范一些。  必须是中文片名,加英文片名(不能是法文、韩文、日文等,不易管理...)

  • 纯数字的片名,也得规范。 比如,最终定名: 二零一二_2012...
  • 中文电影,也得配英文片名, 举例,最终定名:白蛇:缘起_White Snake ...
  • 其它语种的片名,必须改为英文片名,比如:垫底辣妹_ビリギャル, 须改为: 垫底辣妹_Flying Colors ...

捕2获.jpg

更名,可以在TMM中实现,或者,直接编辑 BDMV片源所属的index.nfo (或ISO 所属的 movie.nfo )...

捕4获.jpg

逐渐地、再改由自编程序去担当,从正规网站(idmb),先下载所有语种的片名,再找出:英美发行版的英文名...



  Yuran 最近新学的、高级编程语言,是什么呢?

Python
at06r-4beaa.jpg

  效率高,速度快,功能繁多(就连自编程序实验时的、Windows 下的出错,都能捕捉、显示)。

5捕获.jpg

不仅如此,还能留下‘证据’(我在实验中,埋了那么多的‘雷’,都能记录在案)!

捕6获.jpg

  如此细致的审核机制,在DIY编程中,都能实现。足以应用到:每个硬盘( 10TB数量级的)片源管理中!

捕获.jpg

还在继续编程、实验,紧接着,就是:

  • 按视频规格、音频规格,自动划分文件夹、自动归档。
  • 然后是,字幕的自动下载、字幕规格的、自动改制...
  • 最后呢,尝试  HDR 自动切换!

免费评分

参与人数 1活跃 +3 H币 +25 收起 理由
hao4k + 3 + 25 精辟极了!

查看全部评分

本帖被以下淘专辑推荐:

回复

使用道具 举报

全部回复2

nmanz 发表于 2021-9-8 15:35:11

nmanz 2

2021-9-8 15:35:11

谢谢分享
回复 支持 反对

使用道具 举报

豪斯 发表于 3 天前

豪斯 3

3 天前

有点深奥啊!!!
回复 支持 反对

使用道具 举报

   发表回复

您需要登录后才可以回帖 登录 | 立即注册

返回列表 本版积分规则

:
白银玩家
:
未填写

主题

帖子

积分2201

  • 在线客服

  • 返回顶部