2014/08/19

Open JTalk のコマンドのパラメータ

何も知らないので、正確性が何もない
パラメータ初期値範囲正確でない説明
-sauto1 ~ サンプリング周波数
-pauto1 ~ フレーム周期、分析をする時間間隔
-aauto0 ~ 1オールパス値、位相だけをバラつかせることで音が自然になるらしい
-b00 ~ 1ポストフィルタ値、統計モデルによる平滑化による音質劣化を緩和するらしい
-r10 ~ 話す速さ
-fm10 ~ 追加ハーフトーン
-u0.50 ~ 1有声/無声境界値
-jm00 ~ 1スペクトラム系列内変動の重み、統計モデルによる平滑化で失われる特徴量を考慮した音声合成をする時の重み
-jf00 ~ 1F0系列内変動の重み、F0は基本周波数のことらしい、F0に対して特徴量を考慮して音声合成する時の重み
-z00 ~ 音声バッファサイズ

結論

以上のような理解のまま、パラメータを変えまくって試してみた。

オールパス値は、低いとピーッという音に、高いとザーッという音になる
ポストフィルタ値を大きくすると、音が揺らぐ感じ
追加ハーフトーンも、音が揺らぐ感じ
有声/無声音は、大きくすると息がすぐに切れる
変動の重み が大きいとクリアな音声になる。大きすぎると乱れた感じになる。

このパラメータとは関係がないけど、たぶん辞書にある日本語の単語が続くほうが上手く分解して読んでくれるみたい。

結果、速度と声の明瞭さを少し下げて使うことにした。
>open_jtalk -x C:\open_jtalk\dic -m C:\open_jtalk\voice\mei_normal.htsvoice -s 48000 -p 240 -b 0.1 -a 0.55 -r 0.75 -fm 0 -u 0.2 -jm 0.5 -jf 0.5 -z 8000 -ow 1740.wav 1740.txt

Windows で Open JTalk を使う方法

ソフトウェアが 修正BSDライセンス、データが CC BY で公開されている音声合成 Open JTalk を Windows で導入する方法を調べてみた

主な道具

HTS voice: 訓練データ
hts_engine api: 訓練データから音声合成するエンジン
Dictionary for Open JTalk: 形態素解析に使う辞書
Open JTalk: 上記のものを組み合わせて音声合成するシステム

導入方法

OptnJTalk のビルドの仕方
http://neu101.seesaa.net/article/384051747.html

MMD-Agent mei の音声ファイルについて
http://kledgeb.blogspot.jp/2014/05/ubuntu-open-jtalk-3-mmdagentmeimei-mei.html

結論

Open JTalk のページから、OpenJTalk と 辞書 と 音声 をダウンロード
hts engine API のページから、hts engine API をダウンロード
OpenJTalk と hts engine API を nmake でビルド
open_jtalk コマンドで 辞書 と 音声 と読み上げるテキストを指定すれば音声合成できる
MMD-Agent mei のページの Sample Script をダウンロードして mei の音声が入手できる

Open JTalk や hts engine API は Makefile.mak を使って nmake で簡単にビルドできたり、
mei の音声はそのまま使える .htsvoice版が配布されていたり、
少し前はこの辺りがめんどうだったらしいことが、今は簡単になっているらしい

2014/08/18

ソフトウェアライセンス の調査中

FStap という自作ライブラリは

Json.NETMITライセンス
HtmlAgilityPackMS-PL
NDde独自のライセンス
F# DataApache License, version 2.0

というライセンスのものを使っている。

Interop.ShdocVw.dll は自動生成されるものなので特にライセンス無しらしい

ProvidedTypes-head.fs というのをコピペしているけど、
F# Data に含まれるものだから Apache License, version 2.0 が適用されてると考えていいのかな・・

Apache License, version 2.0
http://vividcode.hatenablog.com/entry/license/android-app-with-apache-license-2.0

MS-PL
http://blogs.msdn.com/b/shintak/archive/2013/02/26/10397157.aspx

NDde
http://ndde.codeplex.com/license

2014/08/17

ソフトウェアのアイコンにCreative Commons ライセンスを使う場合

略称の意味

BY作者、作品名、ライセンス を表示する
SA派生物には同じライセンスをつける
ND派生物を作らない
NC商用目的で使わない

ライセンスは
  • CC BY
  • CC BY-SA
  • CC BY-ND
  • CC BY-NC
  • CC BY-NC-SA
  • CC BY-NC-ND
の6種類がある

ソフトウェアに Creative Commons ライセンスのアイコンなどを入れる場合

http://piro.sakura.ne.jp/latest/blosxom/mozilla/xul/2008-04-02_license.htm
元のライセンスの制限を外したライセンスでは公開できない
アイコンに SA がついている場合、ソフトも同じライセンスで公開するしかなくなる

http://stackoverflow.com/questions/8893135/using-cc-by-sa-music-in-a-closed-source-game
その国の著作権法で派生物とは何かにより、
CC BY-SA のコンテンツを利用したソフトウェア を CC BY-SA で配布するべきか決まるらしい。
日本の場合、派生物 は 二次的著作物 と呼ばれていて、それに該当するものは
「著作物を翻訳し,編曲し,若しくは変形し,又は脚色し,映画化し,その他翻案することにより創作した著作物をいう」
らしい。アイコンをそのまま使ったソフトウェアはこれに該当せず、「複製権」「公衆送信権」などの利用は、CC BY-SA で承諾されていると解釈できるような気もする。

結論

CC BY じゃないと、ソフトウェアに使用するには相当な制約を受ける。

アイコンの場合、苦労して作ってわざわざ公開した人が、
なんとなく SA や ND を付けてしまうと、
それは多くのケースで他人が利用できないし、
BY だけでも、派生物も含めて公開した本人の著作物で、著作権表示はしてもらえる。

参考

Creative Commons ライセンスのつけ方
https://wiki.creativecommons.org/Marking_your_work_with_a_CC_license

Creative Commons ライセンスのついたものの使い方
https://wiki.creativecommons.org/Best_practices_for_attribution

Creative Commons ライセンスの選び方
https://creativecommons.org/choose/

各ライセンスの説明
https://creativecommons.org/licenses/

SIL OPEN FONT LICENSE
http://scripts.sil.org/cms/scripts/page.php?item_id=OFL_web

2014/08/16

CSS でのフォント指定について調べてみた

いろいろなフォントを表示してみる

Verdana この行は style="font-family:Verdana" というスタイルシート指定をしています。
Lucida Grande この行は style="font-family:Lucida Grande" というスタイルシート指定をしています。
Hiragino Kaku Gothic ProN この行は style="font-family:Hiragino Kaku Gothic ProN" というスタイルシート指定をしています。
Hiragino Mincho ProN この行は style="font-family:Hiragino Mincho ProN" というスタイルシート指定をしています。
Meiryo この行は style="font-family:Meiryo" というスタイルシート指定をしています。
sans-serif この行は style="font-family:sans-serif" というスタイルシート指定をしています。
serif この行は style="font-family:serif" というスタイルシート指定をしています。
Segoe UI この行は style="font-family:Segoe UI" というスタイルシート指定をしています。
Arial この行は style="font-family:Arial" というスタイルシート指定をしています。
Helvetica この行は style="font-family:Helvetica" というスタイルシート指定をしています。
Yu Gothic この行は style="font-family:Yu Gothic" というスタイルシート指定をしています。

結論

丸っこい英文フォント「Verdana」
Mac用のフォント「ヒラギノ角ゴ ProN」
Windows用のフォント「メイリオ」
ゴシック体の総称「sans-serif」

という順番で指定してみることにした。

この行は style="font-family: Verdana, 'Hiragino Kaku Gothic ProN', Meiryo, sans-serif;" というスタイルシート指定をしています。

2014/08/15

SEOについて調べてみた titleタグ、description編

titleタグ

titleタグは検索結果のタイトルとして表示される
長さは 数単語、フレーズ 程度
ユーザー と 検索エンジン に分かるように
各ページごとに違うものを書く
簡潔な説明を書く

meta name="description"

descriptionタグは検索結果の説明として表示される、されない時もある
長さは1文、2文、段落 程度
具体的にページの内容が分かるような要約をする
各ページごとに違う説明を書いたほうが検索する側には分かりやすい
数千、数百万のページがある場合は、各ページの内容に従った要約を自動生成してもいい


参考文献:

2014/07/05

blender の操作方法

3D View

ホイール: ズーム
Shift + ホイール: 上下
Ctrl + ホイール: 左右
真ん中ボタンでドラッグ: 回転
Shift + 真ん中ボタンでドラッグ: パン
Ctrl + 真ん中ボタンでドラッグ: ズーム
Ctrl + Alt + Q: 4画面