I just checked your nuq bop bom 'ay''a'mey, having replaced all of the 
non-standard letters (Q, tlh, etc) with their xifan equivalent. Here aremy  results:<div><br></div><div>Freq.<span style="white-space:pre-wrap">       </span>Letter</div>
<div>1406<span style="white-space:pre-wrap">      </span>a</div><div>1138<span style="white-space:pre-wrap">    </span>z (')</div><div>779<span style="white-space:pre-wrap">     </span>o</div>
<div>732<span style="white-space:pre-wrap">       </span>h (H)</div><div>688<span style="white-space:pre-wrap"> </span>e</div><div>593<span style="white-space:pre-wrap">     </span>i (I)</div>
<div>553<span style="white-space:pre-wrap">       </span>d (D)</div><div>543<span style="white-space:pre-wrap"> </span>u</div><div>506<span style="white-space:pre-wrap">     </span>j</div>
<div>426<span style="white-space:pre-wrap">       </span>v</div><div>385<span style="white-space:pre-wrap">     </span>m</div><div>378<span style="white-space:pre-wrap">     </span>g</div>
<div>333<span style="white-space:pre-wrap">       </span>c (ch)</div><div>327<span style="white-space:pre-wrap">        </span>s (S)</div><div>322<span style="white-space:pre-wrap"> </span>n</div>
<div>312<span style="white-space:pre-wrap">       </span>l</div><div>298<span style="white-space:pre-wrap">     </span>b</div><div>298<span style="white-space:pre-wrap">     </span>q</div>
<div>253<span style="white-space:pre-wrap">       </span>y</div><div>243<span style="white-space:pre-wrap">     </span>r</div><div>241<span style="white-space:pre-wrap">     </span>t</div>
<div>212<span style="white-space:pre-wrap">       </span>w</div><div>204<span style="white-space:pre-wrap">     </span>p</div><div>198<span style="white-space:pre-wrap">     </span>x (tlh)</div>
<div>180<span style="white-space:pre-wrap">       </span>k (Q)</div><div>145<span style="white-space:pre-wrap"> </span>f (ng)<br><br>That doesn't seem to match up with your results, but that be from my only checking your first book, and you checking your entire book.<br>
</div><br><br><div class="gmail_quote">On Sat, Jan 5, 2013 at 12:27 AM, Robyn Stewart <span dir="ltr"><<a href="mailto:robyn@flyingstart.ca" target="_blank">robyn@flyingstart.ca</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
I followed Felix's advice deleted all occurrences of the most common character names, then deleted all X, Z and F and then redid the search. It's still a little skewed towards the letters that are the same in xifan as tlhIngan--I didn't strip out the pIqaD titles, so for example m is M in xifan but y is y, meaning that yay will be counted where it occurs in an 'ay' per but may won't be.<br>

<br>
qaghwI' is still the second most frequent letter, so a good Scrabble set should have as many qaghwI'mey as 'atmey, or at least as  many as 'etmey.<br>
<br>
Freq.   Letter<br>
72543<br>
39022   a<br>
38237   '<br>
21465   e<br>
20702   o<br>
19952   I<br>
19760   H<br>
18060   u<br>
15987   j<br>
13557   D<br>
12305   m<br>
11565   l<br>
9979    v<br>
9892    q<br>
9647    ch - this was the frequency for c, with h at 9633, the discrepancy explained by a few non-Klingon words with c or h<br>
9530    b<br>
9359    S<br>
9271    Z --> gh<br>
9145    p<br>
8695    t<br>
8105    n<br>
7648    y<br>
7422    X --> tlh<br>
6611    w<br>
5793    Q<br>
4978    r<br>
3744    F --> ng<br>
-------<br>
Here are the other symbols and non-Klingon letters. (I moved the mevwI' and yevwI' down to here). They are uninteresting, but just give you an idea of what other junk is in the file. I honestly think most of it is from xifan (the way I have to write in order to use my pIqaD font). There is a more interesting list following this one.<br>

<br>
14365   .<br>
5067    ,<br>
1122    ?<br>
691     !<br>
171     -<br>
127     O<br>
126     @<br>
121     A<br>
94      U<br>
80      E<br>
69      &<br>
66      M<br>
63      L<br>
62      T<div class="im"><br>
62      :<br>
59      G<br>
57      #<br>
57      $<br>
57      %<br>
55      ^<br>
54      N<br></div>
51      (<br>
51      )<br>
47      s<br>
47      *<br>
42      J<div class="im"><br>
41      P<br>
40      C<br>
39      K<br>
39      B<br></div>
38      g<br>
35      k<br>
30      Y<br>
30      R<br>
29      W<br>
27      i<br>
26      V<br>
18      d<br>
6       "<br>
6       ;<br>
5       1<br>
5       2<br>
4       5<br>
3       9<br>
3       0<br>
3       3<br>
3       /<br>
3       6<br>
2       8<br>
2       7<br>
1       4<br>
1       [<br>
1       ]<br>
1<br>
1       ©<br>
3152    «<br>
4       ­<br>
3129    »<br>
<br>
And now I have a theory why j is the third most common consonant after ' and H.  There's a lot of dialogue in the story, so a lot of jatlh, but that didn't do it, because tlh is one of the least common letters. It's all the first person statements: jIlegh and jIjaH and jIyaj.  Here are the top words used:<br>

<br>
Unique words:22058  Total words:71912<br>
Freq.   Word<br>
2152    jatlh<br>
1751    .<br>
1736    'ej<br>
1265    'e'<br>
1118    ,<br>
1089    'ach<br>
513     je<br>
429     HoD.  - three of my major characters are captains.<br>
410     jatlh<br>
394     tlhIngan - interesting. I really wasn't aware I used the word that much. I guess the aliens do.<br>
341     HoD<br>
295     'a<br>
277     je.<br>
273     Duj<br>
265     ?<br>
263     ghIq - pretty funny considering the word didn't exist a few years ago.<br>
258     qImyal - a character name I didn't take out<br>
254     DaH<br>
210     chaq<br>
204     yaS<br>
201     wa'<br>
185     latlh<br>
185     Hoch<br>
183     law'<br>
180     vay'<br>
177     neH<br>
169     cha'<br>
158     qaStaHvIS<br>
156     ghaH<br>
150     jatlh.<br>
147     HoD,<br>
147     loQ<br>
143     wej<br>
139     Hol<br>
137     pa'<br>
135     SIbI'<br>
135     lojmIt<br>
133     pagh<br>
133     ghaytan<br>
132     De'<br>
127     neH.<br>
126     Hung<br>
122     vaD - from vajarvaD and 'eSSImvaD, but I deleted the character names stranding the suffix.<br>
115     vaj<br>
110     meH<br>
105     qama'<br>
103     QumwI'<br>
101     net - interesting!  Never thought I used that that much.<br>
100     be'<br>
95      'avwI'<br>
94      Sa'<br>
94      nov<br>
93      pay'<br>
93      wo'<br>
93      quv - although the character counting is case sensitive, the word-counting isn't, so this is Quv and quv<br>
93      tIr - ha ha, if you've read the story you know why this one, love ya QeS.<br>
93      ghop<br>
91      mIch<br>
90      qatlh<br>
89      Qel/qel<br>
87      not<br>
85      'ungya - oops, another character name<br>
85      qImyal.<br>
83      ravDaq - okay that's just funny.  A lot of things take place on the floor in this novel.<br>
81      Qa'bar - another character, didn't think he was that important<br>
80      nom<br>
80      loD<br>
80      bIQ - that does make sense<br>
79      beq<br>
78      HoS<br>
78      chu'<br>
78      'oH<br>
78      ghu'<br>
77      -<br>
77      wa'DIch<br>
77      mu'mey<br>
75      tlhoS<br>
75      nuq/nuQ<br>
75      ghaH.<br>
74      reH<br>
74      naDev<br>
72      Qa'bar.<br>
70      Qu'/qu'<br>
70      nuH<br>
69      'oy' - ha! Did I really hurt people that much?<br>
69      Sa'.<br>
68      Dugh - the name of one of the ships.<br>
68      HIq - pretty hard drinking Klingons, considering that the aliens who take up half the story hardly touch the stuff<br>
67      vay'<br>
67      loS<br>
67      muD<br>
67      bom<br>
67      qab/Qab - yep I shoehorned Qab in somewhere<br>
67      nISwI' - lots of those<br>
66      retlhDaq - wow, describing locations = more common than I thought<br>
66      DeghwI'<br>
66      DIr<br>
66      ...<br>
64      jang<br>
64      jagh<br>
63      Hagh<br>
63      taj<br>
62      QeDpIn.<br>
62      qImyal,<br>
62      DeS<br>
62      lo'<br>
61      SaH<br>
61      «<br>
60      meHDaq<br>
60      vagh - these numbers might be from chapter headings<br>
60      tugh<br>
59      veS - another ship name<br>
58      chay'<br>
58      'op<br>
58      puS<br>
57      Qel.<br>
57      'Iw  - heh, it turned up later than Hagh<br>
56      motlh<br>
56      DIvI'<br>
55      «DaH<br>
54      ghogh<br>
54      nach<br>
54      may'<br>
54      DaHjaj<br>
54      pe'vIl<br>
54      Sov<br>
53      be'tlhar - another name<br>
53      ben<br>
53      Soj<br>
52      batlh<br>
52      pIj<br>
52      Daq/DaQ<br>
52      potlh<br>
52      jonwI'<br>
52      'oH.<br>
52      Hegh  - this is such a Klingon list<br>
51      nID<br>
51      nuv<br>
51      QeDpIn<br>
51      ghaHvaD<br>
50      naQ<br>
50       HungpIn<br>
<br>
Most of the words are adverbs or conjunctions because they are the only words that don't take affixes. Nouns and verbs so often have affixes on them that they don't have high frequency in any one configuration. Here's a chunk of  lower frequency, all the same verb, and of course not including the versions starting with ma- vI- mu- orcetera.<br>

<br>
5         FAZ<br>
1       FAZBE'.<br>
1       FAZBE'PU'<br>
1       FAZCHUZ<br>
1       FAZDI'<br>
1       FAZLAH<br>
2       FAZMEH<br>
1       FAZPU'WI'PU'<br>
1       FAZPU'›<br>
1       FAZQA'LI'.<br>
1       FAZQAF.<br>
1       FAZQAFBE'WI',<br>
1       FAZQO'.<br>
1       FAZRUP<br>
1       FAZRUPDI'<br>
1       FAZRUPQU'CHOH<br>
1       FAZRUPWI'PU'.<br>
1       FAZTA'BOZ<br>
1       FAZTA'MO'<br>
1       FAZTAH<br>
1       FAZTAHVIS<br>
<br>
If someone wants more data I can work more on this.<br>
<br>
- Qov<div class="HOEnZb"><div class="h5"><br>
<br>
At 17:36 '?????' 1/4/2013, you wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Kind of a rookie solution, but what you could do to check the frequencies of ng/gh/tlh is to make a cooy of your document and then do a Find & Replace thusly:<br>
<br>
tlh -> X<br>
gh -> Z<br>
ng -> F<br>
<br>
…or some other letters that aren't much used already (do a search first so you can subtract pre-existing ones from the total.<br>
It's important to do gh before ng, because otherwise ngh will become Fh, rather than nZ.<br>
<br>
If you'd like, you can also do something similar with alien words/names like Mahoun that you don't want altering the results.<br>
______________________________<u></u>__________<br>
From: Robyn Stewart [<a href="mailto:robyn@flyingstart.ca" target="_blank">robyn@flyingstart.ca</a>]<br>
Sent: Saturday, January 05, 2013 02:18<br>
To: <a href="mailto:tlhingan-hol@kli.org" target="_blank">tlhingan-hol@kli.org</a><br>
Subject: Re: [Tlhingan-hol] Fwd: RE: Klingon Scrabble<br>
<br>
I can, but I don't have a platform in which I can write a clever<br>
script, so this counts each character for itself not as part of its<br>
Klingon letter. Here's what I get, with my comments.<br>
<br>
72543       - That's the space character, what you'd expect for a 75k<br>
word novel.<br>
44671   a  - Our existing distribution gets that right. I wonder if<br>
this is biased by character names. The main character is named vajar.<br>
I'll do a version stripped of character and ship names once I have a<br>
better system.<br>
40793   '    - I told you there weren't enough qaghwI'mey in the<br>
game. It beats out all but one vowel!<br>
28488   h   - This combines the letter's presence in tlh and gh, but<br>
excludes H.<br>
23699   o<br>
22652   e<br>
21140   I<br>
20469   H - I expected this to be more common in text than in the<br>
dictionary, because it's in -taH and -Ha' and -laH and -moH and -meH ...<br>
20213   u  - last of the vowels<br>
19024   l   - biased because this includes l and tlh<br>
17380   t   - biased by t + tlh<br>
17291   j - interesting. One of the ship names has a j and so does<br>
the main character's name. That might be a factor. But the main<br>
character also has a v and and r, so I don't think so.<br>
14365   .  - Heh. Short sentences, eh?<br>
13634   g - A combination of gh + ng<br>
13627   m<br>
13557   D<br>
13455   n - includes n and ng<br>
11737   S<br>
11226   v<br>
9892    q<br>
9647    c<br>
9530    b<br>
9145    p<br>
7685    y<br>
7653    r<br>
6611    w<br>
5793    Q<br>
<br>
So it looks like yay ray way and Qay should be the high-scoring<br>
letters.  Whoda thunk there were over three times as many Haymey as Qaymey.<br>
<br>
As an indication of the cleanliness of the data, here's the rest.<br>
<br>
5067    ,<br>
1702    M - two alien characters, one of whom is a main character,<br>
have names starting in M. The names of alien ships and persons is<br>
also the explanation for most of the non-Klingon alphabetic characters below.<br>
1122    ?<br>
691     !<br>
374     s<br>
172     T<br>
171     -<br>
141     i<br>
132     O<br>
126     A<br>
126     @ - The pIqaD 'ay' titles are typed in xifan hol, which<br>
renders the numbers as cartoon swear words.<br>
120     x<br>
94      U<br>
81      E<br>
76      F<br>
70      R<br>
69      &<br>
63      L<br>
62      :<br>
59      G<br>
57      #<br>
57      $<br>
57      %<br>
55      ^<br>
54      N<br>
51      )<br>
51      (<br>
47      *<br>
43      J<br>
41      P<br>
40      C<br>
39      K<br>
39      B<br>
35      k<br>
30      Y<br>
29      W<br>
27      V<br>
24      X<br>
18      d<br>
16      f<br>
<br>
At 22:52 '?????' 1/2/2013, you wrote:<br>
>Robyn,<br>
>     Could you analyze your own writings? I bet that would give a good<br>
>letter frequency representation.<br>
><br>
>Tim Stoffel<br>
><br>
>--<br>
><br>
>On Tue, 2013-01-01 at 14:09 -0800, Robyn Stewart wrote:<br>
> > That's an interesting question. Is the letter frequency distribution<br>
> > of a large piece of text different than the frequency distribution in<br>
> > a complete wordlist of that language?  I think a list compiled just<br>
> > from TKD affix and vocabulary lists might competitively<br>
> > under-represent qaghwI', as it's in so many affixes.<br>
> ><br>
> > I found a shortage of qaghwI'mey during game play, but the<br>
> > artificiality of the arbitrarily high scores for tlh and ng didn't<br>
> > bother me much. It was just a luck thing.<br>
> ><br>
> > - Qov<br>
> ><br>
> > At 13:21 '?????' 1/1/2013, Felix Malmenbeck wrote:<br>
> > > At the risk of showcasing my ignorance with regards to Scrabble:<br>
> > ><br>
> > > Does one actually need a corpus to decide character values for<br>
> > > Scrabble? I imagine that a lexicon along with the rules for<br>
> > > appending affixes would suffice, as the deciding factor is what<br>
> > > words can be formed, rather than what words are most commonly used<br>
> > > (or do rare/difficult words weigh more heavily in that<br>
> > > calculation?).<br>
> > ><br>
> > ><br>
> > > ______________________________<u></u>______________________________<u></u>________<br>
> > > From: David Holt [<a href="mailto:kenjutsuka@live.com" target="_blank">kenjutsuka@live.com</a>]<br>
> > > Sent: Tuesday, January 01, 2013 22:14<br>
> > > To: tlhIngan Hol mailing list<br>
> > > Subject: Re: [Tlhingan-hol] Fwd: RE: Klingon Scrabble<br>
> > ><br>
> > > > On Mon, Apr 14, 2008 at 11:57 PM, Alan Anderson<br>
> > > <<a href="mailto:aranders@insightbb.com" target="_blank">aranders@insightbb.com</a>> wrote:<br>
> > > > > I got it from DloraH, who got it from janSIy, who I believe<br>
> > > originated it.<br>
> > ><br>
> > > I didn't originate it, but I may have been the first one to bring a<br>
> > > converted set to the qep'a'.  I got the frequencies and values off<br>
> > > this very list and I no longer remember who did the calculations or<br>
> > > came up with the values.  It was probably 15 years ago.  The game is<br>
> > > fun, but the scores are somewhat artificial since the point values<br>
> > > were based on rarity of English letters and so it's weird to have<br>
> > > common letters like <tlh> be worth so many points.  I think any new<br>
> > > calculations should be based on Qov's <nuq bop bom>, since that is a<br>
> > > large piece of original tlhIngan Hol writing.<br>
> > ><br>
> > > janSIy<br>
> > > ______________________________<u></u>_________________<br>
> > > Tlhingan-hol mailing list<br>
> > > <a href="mailto:Tlhingan-hol@stodi.digitalkingdom.org" target="_blank">Tlhingan-hol@stodi.<u></u>digitalkingdom.org</a><br>
> > > <a href="http://stodi.digitalkingdom.org/mailman/listinfo/tlhingan-hol" target="_blank">http://stodi.digitalkingdom.<u></u>org/mailman/listinfo/tlhingan-<u></u>hol</a><br>
> > ______________________________<u></u>_________________<br>
> > Tlhingan-hol mailing list<br>
> > <a href="mailto:Tlhingan-hol@stodi.digitalkingdom.org" target="_blank">Tlhingan-hol@stodi.<u></u>digitalkingdom.org</a><br>
> > <a href="http://stodi.digitalkingdom.org/mailman/listinfo/tlhingan-hol" target="_blank">http://stodi.digitalkingdom.<u></u>org/mailman/listinfo/tlhingan-<u></u>hol</a><br>
><br>
><br>
><br>
>_____________________________<u></u>__________________<br>
>Tlhingan-hol mailing list<br>
><a href="mailto:Tlhingan-hol@stodi.digitalkingdom.org" target="_blank">Tlhingan-hol@stodi.<u></u>digitalkingdom.org</a><br>
><a href="http://stodi.digitalkingdom.org/mailman/listinfo/tlhingan-hol" target="_blank">http://stodi.digitalkingdom.<u></u>org/mailman/listinfo/tlhingan-<u></u>hol</a><br>
<br>
<br>
______________________________<u></u>_________________<br>
Tlhingan-hol mailing list<br>
<a href="mailto:Tlhingan-hol@stodi.digitalkingdom.org" target="_blank">Tlhingan-hol@stodi.<u></u>digitalkingdom.org</a><br>
<a href="http://stodi.digitalkingdom.org/mailman/listinfo/tlhingan-hol" target="_blank">http://stodi.digitalkingdom.<u></u>org/mailman/listinfo/tlhingan-<u></u>hol</a><br>
</blockquote>
<br>
<br>
______________________________<u></u>_________________<br>
Tlhingan-hol mailing list<br>
<a href="mailto:Tlhingan-hol@stodi.digitalkingdom.org" target="_blank">Tlhingan-hol@stodi.<u></u>digitalkingdom.org</a><br>
<a href="http://stodi.digitalkingdom.org/mailman/listinfo/tlhingan-hol" target="_blank">http://stodi.digitalkingdom.<u></u>org/mailman/listinfo/tlhingan-<u></u>hol</a><br>
</div></div></blockquote></div><br>