V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
soundrain
V2EX  ›  分享创造

分享一下目前的开源工作,针对 ACGN 领域的 CoT 翻译模型以及适配的推理前端,可以简单的在本地翻译字幕和电子书和任意文本原样输出。目前 ACGN 领域 Sota 的翻译效果。

  •  1
     
  •   soundrain ·
    soundstarrain · 2 月 27 日 · 1073 次点击

    首先,简单介绍一下工作。这是一个针对轻小说,galgame 等 ACGN 领域文本翻译而训练的翻译模型。相比其他的翻译模型的主要优点是:

    1. 采用了任务针对性的 CoT 过程,针对任务的困难点(如人称,主被动,场景等进行了针对性设计)
    2. 采用平均长度 1500 字以上的长段落进行训练,以获得更好的上下文能力
    3. 在训练集的选择中尝试引入了前沿的核心集选择算法进行筛选。

    模型具体情况: 目前训练了 8b 和 14b 两个参数的模型,共使用 8xH100 全量微调约 2 天。底模是 Sakura-Qwen3-Base ,在此感谢 sakura 和 qwen 的贡献为本工作节省了大量 PT 和 CPT 的时间。

    模型的具体效果, 可以参考我们在这里的测试,使用 COMET (wmt22-comet-da) 指标测试了共 200 个段落级别的数据,效果优于 Gemini3.0pro 以及 claude4.5opus 等 sota 闭源商业模型。用户的反馈结果和实际检查下来也很不错,在 ACGN 领域有着很强的翻译效果,并且还有一点,没有审查,可以翻译某些不可言说的东西()

    我会放一段具体的翻译结果对比到评论区供大家参考。


    然后再简单介绍一下针对翻译模型适配开发的推理前端。(虽说是针对本模型设计但是现在功能已经很全面了)

    可以一键安装然后将日文 epub/txt/srt/ass 等文件翻译,原格式输出。配置简单,并且内置几乎完全可自定义的功能。

    顺带一提使用第三方 API 也是可以用这个 GUI 进行翻译的,具体就不多说了贴几张图吧

    6 条回复    2026-02-28 21:38:33 +08:00
    soundrain
        1
    soundrain  
    OP
       2 月 27 日
    以下是为了大家方便参考翻译能力,选择了 3 个比较难的段落,对比 murasaki14b 和 gemini-3-pro proview 的翻译水平( g3p 是公认的处理跨语言任务最强的通用模型之一)

    1raw:そもそも魔法という事象が、術者の精神領域に内在する想子(プシオン)の波形を、外部世界に存在する事象改変のための起動式として仮定義された情報体に投射し、その結果として世界そのものが保有する復元力――すなわち、物理法則という名の強固な慣性――を一時的に騙し討つことで成立する「欺瞞の奇跡」であるとするならば、彼女が今、目の前で展開している現象は、魔法というカテゴリーに押し込めるにはあまりにも異質であり、むしろ世界そのものの定義を根底から書き換える「創造」の領域に片足を突っ込んでいると言わざるを得ないだろう。通常、現代魔法の理論体系において重要視されるのは、いかに効率よく想子を消費し、いかに迅速に事象への干渉力を最大化するかという一点に尽きるが、彼女の術式には、発動までのプロセスにおける無駄としか思えない儀式的修飾が幾重にも施されており、それが単なる装飾ではなく、因果律という名の鎖を一つずつ丁寧に解きほぐし、物理法則の反作用(バックラッシュ)を術者ではなく「世界そのもの」に肩代わりさせるための、極めて悪魔的かつ天才的な安全装置(セーフティ)として機能しているという事実に気づいた瞬間、背筋を凍りつかせるような戦慄が私の全身を駆け巡ったのである。それは、例えるなら、泥棒が鍵を開けて入るのではなく、家の設計図そのものを書き換えて「最初から扉は開いていた」という事実にすり替えるような、神への冒涜にも等しい所業だった。
    gemini3pro:归根结底,如果将“魔法”这一现象,暂时定义为“术者将内在精神领域的想子( Psion )波形,投射到作为外部世界事象改写程序的启动式这一信息体上,并通过暂时欺骗世界本身所持有的复原力——即名为物理法则的顽强惯性——从而成立的‘欺瞒之奇迹’”,那么她此刻在眼前展开的现象,若硬要塞进“魔法”这个范畴里,未免显得过于异类。倒不如说,她已经一只脚踏进了从根本上改写世界定义的“创造”领域。
    通常,在现代魔法的理论体系中,最受重视的一点无非是如何高效地消耗想子、以及如何迅速地最大化对事象的干涉力。然而,她的术式在发动前的过程中,施加了一层又一层看似纯属多余的仪式性修饰。当我意识到这些并非单纯的装饰,而是为了将名为因果律的锁链逐一细致地解开,并将物理法则的反作用( Backlash )并非转嫁给术者、而是转嫁给“世界本身”来承担的、极度恶魔却又天才般的安全装置( Safety )时,一股令人背脊发冻的战栗瞬间传遍了我的全身。
    打个比方,这就好比小偷不是撬锁进屋,而是直接改写了房子的设计图,将事实替换成了“门从一开始就是开着的”,这简直是等同于亵渎神明的所作所为。
    murasaki14b:如果说,魔法这一现象本质上是术者将内在精神领域中的想子( Psion )波形,投射到外界用于改变事象的预设信息体——即启动式上,并通过暂时欺骗世界本身所拥有的复原力(即名为物理法则的坚固惯性)而成立的“欺瞒之奇迹”;那么,她现在于眼前展开的现象,便显得过于异质,无法被强行归入“魔法”这一范畴,甚至不得不让人认为,她已经有一只脚踏入了从根本上改写世界定义的“创造”领域。通常在现代魔法的理论体系中,最受重视的便是如何高效地消耗想子、如何迅速地将对事象的干涉力最大化,然而她的术式中,却叠加了数层在发动过程看来纯粹是浪费时间的仪式性修饰。然而,当我意识到那并非单纯的装饰,而是为了将名为因果律的锁链逐一细致地解开,并让物理法则的反作用力( Backlash )并非由术者、而是由“世界本身”代为承担,作为极度恶魔化且天才的“安全装置”发挥作用时,一股令人脊背发凉的战栗瞬间席卷了我的全身。那简直就像是——贼人并不通过撬锁入室,而是改写了房屋的设计图,将其篡改为“门从一开始就开着”的事实。这简直是等同于对神明的亵渎。
    soundrain
        2
    soundrain  
    OP
       2 月 27 日
    2raw 結局のところ、僕がその手を差し伸べなかったのは、彼女を救うことによって生じるリスクを恐れたからでも、あるいは自分自身の無力さを痛感していたからでもなく、ただ単に、そうして誰かを救おうとする自分自身の姿が、かつて自分が最も軽蔑していた「物語の主人公気取りの偽善者」そのものであるという事実を、鏡越しに見せつけられるような強烈な既視感と自己嫌悪に耐えられなかったからに他ならないのではないか、という疑念が脳裏にへばりついて離れない。もちろん、そんなものは後付けの言い訳に過ぎず、本当はただ、彼女が絶望の淵で泣き叫ぶ姿を見ることで、自分だけが不幸なのではないという歪んだ安堵感を得たかっただけなのかもしれないし、あるいは、そうやって自己分析を繰り返すことで「自分は自分の卑劣さを理解している理性的な人間だ」という免罪符を無意識のうちに発行し、良心の呵責から逃れようとしているだけなのかもしれませんが、いずれにせよ、あの瞬間、彼女の瞳から光が消え失せ、絶望という名の暗い深淵がその華奢な身体を飲み込んでいくのをただ傍観していたという事実は、どれだけ言葉を尽くして正当化しようとも、あるいはどれだけ自虐的な論理で自分を断罪しようとも、決して覆ることのない、僕という人間の本質的な醜悪さを証明する決定的な証拠として、これからの人生において僕の喉元に突きつけられ続ける鋭利な刃となるだろう。
    gemini3pro:其实我当时之所以没有伸出援手,既不是因为害怕救她会带来风险,也不是因为深感自己的无力,我脑海中盘踞着一个挥之不去的疑念:归根结底,我只是无法忍受那种强烈的既视感与自我厌恶——那一刻,试图去拯救谁的自己,仿佛隔着镜子让我看到了曾经最被我轻蔑的“自以为是故事主角的伪善者”的丑态。
    当然,这不过是事后的借口罢了。或许我内心深处只是想通过看着她在绝望深渊中哭喊的样子,来获得一种“不幸的并不只有我一人”的扭曲安堵感;又或者,我是想通过这种不断的自我分析,在无意识中给自己发放一张写着“我是个能理解自身卑劣之处的理性之人”的免罪符,好让自己从良心的苛责中逃脱。
    但无论如何,在那一瞬间,她眼中的光芒熄灭、名为绝望的黑暗深渊将其纤细的身躯吞没,而我只是在一旁袖手旁观——这一事实,无论我用多少言语去正当化,亦或是用多么自虐的逻辑来审判自己,都绝不会被推翻。它将成为证明“我”这个人类本质上何其丑恶的决定性证据,在今后的人生中,化作一把锐利的尖刀,永远抵在我的喉头。
    murasaki14b:归根结底,我之所以没有向她伸出援手,既不是因为害怕救赎她所带来的风险,也不是因为痛感到了自身的无力,而仅仅是因为,我无法忍受那种强烈的既视感与自我厌恶——仿佛自己试图拯救他人的姿态,通过镜子映照在自己眼中,与过去最为鄙夷的“自以为是故事主角的伪善者”完全重合。当然,这些都只不过是为了事后找的借口,真相或许只是我单纯想通过目睹她在绝望深渊中哭喊的模样,来获得一种“并非只有自己不幸”的扭曲安堵感;又或许我只是在通过反复的自我剖析,在无意识中给自己颁发一张名为“我是一个理解自己卑劣之处的理性之人”的免罪符,从而逃避良心的呵责。但无论如何,那一瞬间,她眼中的光芒消失,名为绝望的漆黑深渊将她纤弱的身体吞没,而我只是在旁冷眼旁观。这一事实,无论我用多少言语去正当化,抑或是用多么自虐的逻辑来断罪自己,都绝不会被推翻。它将成为证明我这个人的本质丑恶的决定性证据,化作一柄锋利之刃,将在我此后的人生中,一直抵在我的咽喉之上。
    soundrain
        3
    soundrain  
    OP
       2 月 27 日
    3raw 帝国暦四五八年に勃発した北部戦線における大規模攻勢、後に「鉄屑の三日間」と称されることになるその凄惨な消耗戦が、単なる領土的野心を背景とした侵略行為ではなく、帝国内部で腐敗しきっていた軍産複合体が抱える過剰な在庫を一掃し、同時に次世代型自律機動兵器の実戦データを収集するために仕組まれた、極めて冷徹かつ計算高い「在庫処分」であったという事実は、当時最前線で肉挽き機のような砲火に晒され、泥と血に塗れて死んでいった数万の将兵たちにとっては、知る由もない、あるいは知ったところで到底受け入れ難い悪夢のような真実であったに違いない。だが、歴史の歯車というものは常に無慈悲なものであり、彼らの犠牲の上に成り立った「平和」という名の砂上の楼閣が、隣国連邦との間に結ばれた不可侵条約という薄氷によって辛うじて維持されている現状を鑑みれば、あの殺戮劇を「必要悪」と断じて憚らない中央の官僚たちの傲慢な論理も、国家という巨大なシステムを維持するためには、ある種の正当性を帯びてしまうという、吐き気を催すような現実がそこには横たわっている。結局、英雄として祭り上げられた彼らの遺族に支払われたのは、国債という名の紙切れと、名誉という形のない虚飾だけであり、その裏で莫大な利益を上げた軍需企業が、今や帝国の政治決定権すら左右するほどの権力を有しているというこの国の構造的欠陥こそが、次なる悲劇の種を確実に蒔き続けているのだ。
    gemini3pro:帝国历四五八年爆发的北部战线大规模攻势,也就是后世称之为“废铁的三日”的那场凄惨消耗战,其真相并非单纯是基于领土野心的侵略行为,而是帝国内部早已腐败透顶的军工复合体为了清空过剩库存,并同时收集次世代自律机动兵器实战数据而策划的一场极度冷酷且充满算计的“库存处理”。这一事实,对于当时在最前线暴露于绞肉机般的炮火中、满身泥泞与鲜血死去的数万将兵而言,是无从知晓,即便知晓了也绝对无法接受的噩梦般的真相。
    然而,历史的齿轮总是无情的。鉴于建立在他们牺牲之上的这座名为“和平”的空中楼阁,如今仅仅是靠着与邻国联邦签订的互不侵犯条约这层薄冰才勉强维持,那么中央官僚们将那场杀戮断言为“必要之恶”的傲慢逻辑,为了维持国家这一巨大系统的运转,竟然也带上了一种正当性——这令人作呕的现实便横亘于此。
    最终,作为英雄被供奉起来的死者,其遗属所得到的只有名为国债的纸片和名为荣誉的无形虚饰;而在其背后攫取了莫大及其利益的军需企业,如今甚至拥有了左右帝国政治决策的权力。这个国家的这种结构性缺陷,正是确凿无疑地播撒着下一场悲剧种子的元凶。
    murasaki14b:帝国历四五八年于北部战线爆发的大规模攻势,其后被称为“废铁之三日”的那场惨绝人寰的消耗战,实则并非单纯基于领土野心的侵略行为,而是一场极其冷酷且算无遗策的“清理库存”。其真实目的,是为了扫清帝国内部已腐败透顶的军需复合体所积压的过剩库存,同时收集次世代型自律机动兵器的实战数据。对于在当时最前线被如绞肉机般的炮火肆虐、死于泥泞与血泊中的数万将士而言,这真相无从知晓,抑或是即便知晓了也绝难接受,那必然是如噩梦般的现实。然而,历史的齿轮总是冷酷无情的。考虑到目前与邻国联邦之间,那座建立在牺牲之上的、名为“和平”的砂上楼阁,正由名为“互不侵犯条约”的薄冰勉强维系着,那么将那场杀戮剧断定为“必要之恶”也毫不避讳的中央官僚们的傲慢逻辑,为了维持名为国家的巨大系统,也确实带上了某种正当性——这种令人作呕的现实横亘在那。最终,被捧为英雄的遗属们,所得到的仅仅是名为国债的纸片,以及名为名誉的无形虚饰。而在背后攫取巨额利益的军需企业,如今已拥有足以左右帝国政治决定权的权力。这个国家的结构性缺陷,正确实地不断撒下下一场悲剧的种子。
    Tohrusky
        4
    Tohrusky  
       2 月 27 日
    ### Reviewer 2

    Paper Summary:
    This post introduces Murasaki, an open-source CoT translation model tailored for the ACGN domain, complete with an out-of-the-box local inference GUI.

    Summary Of Strengths:
    The project demonstrates exceptional practical utility.

    Summary Of Weaknesses:
    Where is the technical report?

    Comments Suggestions And Typos:
    Have you considered or experimented with Reinforcement Learning (RL) post-training methods, such as GRPO or PPO?

    Confidence: 3
    Soundness: 3
    Excitement: 4
    Overall Assessment: 2.5 = Borderline Findings
    soundrain
        5
    soundrain  
    OP
       2 月 28 日
    @Tohrusky

    To Reviewer 2:

    General Response:
    We sincerely thank Reviewer 2 for their valuable time and for recognizing the "exceptional practical utility" of our work. We address your insightful comments below:

    Response to Weaknesses (Where is the technical report?):
    We thank the reviewer for pointing this out. Due to the strict 0-page limit of this forum "conference," the technical report was unfortunately omitted. Furthermore, as this is a passion-driven community project rather than a formal academic paper, we leave the writing of a formal technical report to "Future Work." For now, all technical details are provided in the form of the ultimate pseudocode: the open-source repository itself.

    Response to Comments (Regarding RL post-training):
    We highly appreciate the reviewer's brilliant and constructive suggestion! We have indeed considered Reinforcement Learning. However, rather than GRPO or PPO, our primary focus is on DPO (Direct Preference Optimization).
    Given our compute constraints (and to avoid the high blood pressure caused by exploding loss curves in PPO), DPO offers a much more elegant and stable path for translation alignment. Especially when it comes to preserving the model's ability to translate certain "unspeakable things," DPO seems perfectly suited for aligning with human preferences.

    Conclusion:
    We hope our rebuttal fully addresses your concerns. If so, we humbly request the reviewer to consider raising the Overall Assessment score to 4.0 (Strong Accept)! Please, my graduation (crossed out) my hobby depends on it!
    Tohrusky
        6
    Tohrusky  
       2 月 28 日
    @soundrain
    ### Reviewer 2

    All my concerns have been addressed. I will happily raise my OA score to 5 (Consider for Award). Good Luck!
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1771 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 16:16 · PVG 00:16 · LAX 09:16 · JFK 12:16
    ♥ Do have faith in what you're doing.