6/10/2005

繁简转换,和搜索引擎带来的类DoS攻击

这两天研讨这几个博客和广告有着现实性的意义,其中原因就在于对于博客和主页这两者的关系和应该做到的程度没有什么谱。现在看来,一个完善的主面显然是应 该超越博客的,模板是最好的办法,可以把界面和css的工作扔出去给用户自已来。作解释性的输出对我来说不是一件太难的事情。这也可以应对目前界面人员职 业水平低的缺点,事实上,弄不好除了我不会用PS外,我的水平也是最高的;而PS,看来是要学的。对于网络的广告需要作一个详尽的规划,这不是今天的事 情。另一个重要的部分就是图片的上载和管理,当然包括了空间的管理和限制,这两个模板都只能推后实现。而陈今天早上说的挂号也是一个。

当 妈子把保险的存折拿回来后,发现存折没有扣钱,反而是电话把钱扣了??我从来没有印象是使用这个存折去交电话费的。这个存折一直是专折专用!而实际上从 上面看来,已经给扣了好几个月了。这次没有扣款可能有两个原因,一个是收到通知的时间很迟,其二是如果按通知说的时间,我应该是已经迟了交进去,其次是黄 黄做的好事:她把我这个拿去交了电话费,弄得帐面的钱不够了。而工商银行网点少排队时间长也是一个问题。如果从通知看周一周二不办事,那么我还要现在提早 过去呢。妈的!

现在保姆和猪猪和妈子一起去打预防针,已经是10:30分了,出去的话她们回来可能会没有门进的。而且赶到后也已经是中午,看来还是下午去吧,或者应该把那个社会保险也一起办下来了。难道20日还要再走一次吗?就这样决定吧。

目前在开发的时侯,由于数据库是共用的,而processor已经改由数据库的metadata识别,这样如果更改了数据库而没有及时更新类文件,就会在前台出错!因此,类似的修改还是在本地先进行吧。

动 态个人网页需要增加一个单例短文属性表。象目前前台的一些属性也应该可以使用这个,这些属性修改的机率比较低,而读取的机率比较高,也不存在回复啊,查 询啊的故事。其实是可以使用文件,然后直接往目前中生成这些静态的文件。目前仍没有担心系统性能不足,如果到了那一天,也的确可以把大量的文章作为静态的 文件发布出去,这样也可以大大提高系统的性能容限。这个表的读取每次只是显示有限的几个,所以可以使用数据库;但如果数量稍大,那么就变成一页要读几次数 据库,那是万万划不过来的。

博客那里需要更多的一个帐号,从过程看,似乎目前最有把握拿到的是垃圾那个,就先用那个帐号申请,看看能否成 功。手头上好象还有几个网站可用的,总之,帐 号可以多一两个,但当前大概只需要有两个就可以了,如果有三个当然是最好的。无论如何,如果发表的内容不是那么阳春白雪容易挨骂的话,特别是在这个国家, 还是小心一点为好。申请过程中网景死了,它的postcard实在是一个垃圾,用例假设完全是失败的。

今天第一次接触到繁简转换,意外的 是windows的那个内码转换工具完全不能工作??估计它不是这样用的,大概是用来转换象properties文件之 类的多语言版本之用。而在互联网上,我找回来的那个繁简转换似乎更简单易用,可以把它做到一个网上服务的类型。由于blogspot诸网页都是大陆无法看 到的,因此,专门作为一个面向海外读者的网站可能更为划算。blog-city也是一个以unicode为主的网站,不过,由于它使用的是html所以也 没有多大的所谓。我想呢,凡是这种面向国外的网站,大概都主要使用繁体会得到更佳的效果。简体就在国内使用吧。

由于整理那个意见,又在博客上花了一点时间,做完了,就听见猪猪在那里哭哭啼啼个不停,因为没有人陪她玩。不过我下午急着去搞保险项目,这事情整整花了我一个下午。

晚 上开始不久,就碰到怪事,网站一下子极慢,并最后死翘翘了,原因不查自明:会话达到了1700多个,而且是短期内的阵发会话,几乎就是等同于DOS攻击 了,这个强度已经远远超过了我进行压力测试的最大值。检查日志,发现同时有几个搜索引擎在扫描我的网站。这些搜索引擎实在有点讨厌,不过看在它可以招引浏 览者的份上,我一直容忍着,但这次是太离谱了,日志表明,其中深址的219.133.49.235居然每秒钟发出十到二十下扫描请求,连续几分钟不停,换成别的任何网站都会受不了 的。我把它禁了以后这种不署名而且无良的搜索我会把它禁掉的。

但除了防火墙禁外,还有没有方法呢?IDS我不敢启用,在公共网路上启用IDS响应很可能导致自我封闭式的DOS,但是这种同一个IP,然后密度很大的行为,如何在程序上加以识别并加以拒绝呢?

records

06-10; 28000said;doctor3; 9.24 read 34000 ; register 35; alexa 7212
06-10 20:00,遭遇搜索引擎?描?密,???1700多,重?,?封?219.133.49.235
06-11 8:45 alexa??10959;????10734,登?51;

6/09/2005

处理集合类型缺陷,研究博客的模板功能以及专家主页的层次

昨晚其实是提早上床睡觉的,但是仍是老毛病,难以深眠,早早就醒,这是精神疲劳的表现。

alexa计数的确是不定时的,早则23点多一点 更新,迟则零晨吧,升了一千多位。这应该是周二的值,这段时间我是一直使用刷新的,但这次好象效果不是太 明显,有可能是由于某些电脑停了,象asoka那台电脑如果没有使用的话,也的确是会带来一定量的影响。周一周二他们出去派卡,所以工作人员上网的比例低 了,也属正常,没有出现大幅度倒退就是很成功的。

昨 天发现的问题,显然是由于集合属性赋值上的不同步,把老的集合值重新拿了出来,所以不能更新。要解决这个问题,唯一的办法就是令它同步,最不济的就是手 工覆盖编码的方法。现在的问题显然是由于更新字段的方向既可能是更新集合,如热点值的用例操作,也可能是更新这个字段值,象这样的roles的操作。 instanceCollections的效果是直接从字段到集合,反之,serialsCollections是从集合到字段。但如果中间一些字段从集 合始,而另一些字段从字符串开始,那么目前的方法就不够了,这就是问题。

完全手工编码显然是低效的,看来还是有相应的解决方案。使用容器 当然是最终的方案,不过目前没有时间。而使用公共方法的调用,然后在每个设入或读出时都进 行一次调用,会是合适的解决方案,缺点是,需要修改那个Coder,其次,如果所有类都更新,短时间内会有系统级的抖动。不过,似乎也想不出更好的办法 了。因此,集合实体的程序其实还没有完全完成,只有当Coder已经完全更新可以自动输出相应的程序后,这个程序才算得上是真正是完成了。

当doSychonize 方法完成后,那么原来的instanceCollection方法就显得过时而可以加以废除了。……好象并非如此的,删除后,由于从数据库读出前没有 entity,所以就无法完成初始化,这是原来没有考虑到的。而当实现从结果集转换成持久对象的过程中,由于并不是根据dao而是根据 class.fields进行抽取的,这样就不能在一开始set入的时侯先设入entity,(当然,强行修改也是可以的),目前使用这个 instanceCollection,可以减少系统变动,也是一件好事。但最终仍然是把它去掉了,原因在于始终不便于从几个地方维护。这个问题完全解 决,已经是中午了……事实上是到了十二点半。

中 午太累了,还是先休息一下。下午从修改文章类别使用这个集合类型开始。但是猪猪在门外吵吵叫叫,加上保姆和黄黄的姑妈也在阳台上吵吵嚷嚷,又不好把她们赶 跑,别人还好说,但猪猪叫我总不能叫她收声的。所以中午这一觉是似睡非睡,和阿琼聊了一会,最后又让高的电话弄醒了,只好起来再继续做事。或者,在书房睡 效率更高一点。

无 意间发现博客中国的页面是根本上全部下载了然后不作显示??这样说来他们的流量中的大部分是虚假的流量。难怪我的那个博 客会如斯缓慢。稍作修改后又发现 它的逻辑是:如果有摘要就显示摘要,否则就显示整个文章体。另外它的图片的下载也是显得非常的慢。调整 博客中国仍然是花了一定的的时间,总是开始时觉得一点点操作就好了,结果最后却发现花了一两个小时。同样是无意中发现,csdn的公告栏中昨天放进去的广 告显示出来了,这样,由于这个公告栏会出现在所有的版面,而相反,博客中国的文章中无法显示广告,因此,这里发布的技术型文章,无论是从评级还是实际效果 上看,都会比在博客中国中要好。难怪昨天的统计渠道数量远远的少于所有汇总的数量,要知道,我的渠道是绝无可能重复的。但是CSDN其实也只是垃圾中的精 品:号称是中国技术代表性站点,选用了asp,还做得很精细,结果是三天两头……有一会儿是可以访问的,其他时侯都是不同形式的死翘翘的。打算在它的公告 栏中加上一个GOOGLE的搜索,但结果却发现让它的一个form给挡住了,打算用脚本绕过它提交,也成功了(原来GOOGLE不可以使用post的), 却是乱的中文提交,结果只能找英文,中文是不成的。不过,事实上就算是在secure网站上的google提交也是不能的,结果是一遍的空白,什么也没 有。这件事情同样是原以为几分钟的事情,结果花了我差不多一个小时。最后发现,在文章可以编辑源代码的版面中一般情况下都可以插入广告,对于象csdn没 有太大的价值,但是对于不能在文章项目中插入广告的blogchina,就有着积极的意义,所以花经了一个多小时,尝试性把第一版和科学版的文章加入了广 告而实际上这次打开博客是想看看内容部分是否可以加入那个小天使的背景图片……实际操作时发现已经是第二次作这个尝试,总之是不行,原因不清楚,也没有心 思现在去找答案了。Google搜索那里转转眼,

文 章方面目前基本上就是在主网上显 示;大致可以分成总网和子网两个类型,而这两个类型也可以通过一个虚拟 的科室进行区别;可以假定总网的文章也可以用到健康网的上面。当加上了另一个类型,如博客和主页时,就需要添加上一个BASE类了,同时,这个操作类型, 似乎还没有相应的操作组件可以使用呢。原打算文章类型使用集合进行调整 ,但把以前的设置 一抄,结果就变成了单列的选择,这也是一个解决的办法,我还是有点想得不算太清楚,就是跨类型的显示有没有必要;是不是受欢迎。现在很清楚,无论是陈还是 那些医生对于如何建设这个网站是没有什么准主意的,那些医生的潜意识中只是将这个看作是一个自已文章的集散地,如果连他们的研究生的文章他们都不愿意发, 那就有点过分阳春白雪了,又怎么可能以共享的方式吸引到其他的专家同行来呢?回想当初的专家黄页所谓的只收副高,思维何等的狭隘!所以完全可以假定,他们 不会愿意接受其他人的文章,尽管自已组织文章的数量总是很有限的。

昨天让老妈子帮手买平安的健康保险,今天又接到电话,要在620以前买下一期的社会保险;这件事情可以记住了,只有几天的时间……好象620是许多事情的一个日子,或者只是巧合?

近 傍晚,高气冲冲地投诉诊室那里修改文章类型权限拒绝,但是我那怕把程序下载到本地调式,仍然是一切正常,直到把dep上的系统重启了一次,也正常了,真 不知是什么原因了。从记录上看,似乎是artype2的原因,但如果是这样的话,www也会有问题的,而且使用管理员帐号也是有问题的,但是事实上那是正 常的。反正,俺不是很清楚,这又是一个matrix现象。

文章的分类同时规分出hzw/ysw并不能代替目前的artype的分类方式, 但是可以令文章介时以分网形式的显示提供更高的设置效率??调整也只是使用 sql命令的短时间操作,所以其实也是无多大所谓的。投稿其实是不存在的,只存在博客文章的采纳,但又出现与投稿同样的问题:那些笨蛋会不会接受人家的投 稿?估计他们完全不能理解使用博客这种形式。现在的很大问题是那些“专家”对互联网是一窍不通,但同时却让他们(应该说是让陈)缚住了手脚,所以无法采用 很多常用的网络经营手段。真要做出点名堂来,唯一的办法就是跳出这些个科室的实际限制。所以能够跳出科室限制的手段都是可以使用的。事实上,由于主页使用 的文章类型都可以用另一个域值的非零标定,这样,就可以做到同时适应于多种使用,或者,这是更合适的办法。

事实上,这个主页就是一个博 客,既然是一个准备要收钱的博客,那就必须去了解一下他人的博客是有什么功能了。根据我对博客的观念:博客的生存之道就是帮助 博客用户通过博客赚钱赚名,然后向他收取费用。显然,目前的大多数博客的操作完全违反了这条规则,可以肯定,都是不会有好结果的。出于这个目的,我逐一地 观察几个博客是否满足这条原则,和满足到了何种程度。结果最精明也是最愚蠢的是显然是歪酷,它的技术选项就是百分百防止博客卖自已的广告的,换言之,它投 资搞那个博客应该是烧钱支持公益不营利事业,大家都知道,这种行径者高尚到愚蠢,然后死去。

另 一个blogcn呢?看上去提供了最强大的模板,接近于blogger的方式,但它的刷新太慢了,我等了差不多半小时还没有看到结果,说不定也是银样蜡枪 头过分精明(本人赞他人聪明精明的话真实含义是那家伙蠢得可怜)。反正俺是困了,明天再说……但是就在我打算睡觉的最后一刻,刷新一下后,发现它全部出来 了,换言之,尽管blogcn的技术(体现在性能上)实际让人不太感冒,但它却是最符合博客的生存原则的,这足以令我对它刮目相看,大概,我应该把主力的 站点移到这个博客上。

6/08/2005

试用了所有的五笔输入法,从86版的选择应该是极点和念青

一直到此前,用得最多的是86五笔,在linux平堂上装了一个念青五笔和另一个默认的五笔输入,除了互相冲突,此活彼死外,linux上的五笔还存在着 严重的缺词缺字;所以用起来感觉远不如在WINDOWS上顺手,当然,windows的客户易用性是无可争议的。86五笔经历过一次升级,98五笔,但却 是有史以来最失败的软件升级案例,王志民显然不是一个软件客户化的专家,他不升级还好,一升级几乎等于判了他自已的五笔死刑。从五笔前途看,王最合适的选 择应该是完全公开五笔作为一个开源项目,然后通过这个开源项目卖自已怕广告,或者,收入会远比现在这样收使用费现实。

五 笔越来越有限制,作为挂在windows2000上的输入法已经开始走向沿落,而以前试过装过几个另类五笔,大同小异。86版的主要问题是词量太少,在 同一台机上长期使用后补充词量可以初步解决这个问题,但是仍是一个不少的工作量,而且换一台机就没有了,总是滑稽!而98根本就是垃圾,与86版几乎没有 继承性,象我这样基本上只使用五笔的用户试过几次转换到98版,都是屁滚尿流地转回到86版,可见基本人会是如何光景?软件的升级,特别是输入法这种升 级,客户的使用习惯继承是最重要的参考因素,而编码的优化是最次要的因素;升级,应该是根据的使用习惯进行优化,而不是另开一套编码。这是最经典的升级导 致被淘态的软件案例。
尽管重新使用五笔86,但是中文输入越来越依靠一个缺乏维护也不公开的编码方式,总不是一个办法,实际上已经明显感觉到了它 的限制,以致于我作文时不得不 在用词时也要考虑五笔实际上能够支持什么词和字。所以一直考虑尝试新的输入法替代方案,可是仍是不得要领,其他的输入法大部分是拼音优化,没有什么特别的 突破,作为非职业的人员来说大概可以满足少量输入的需要,但是不是一种经典的可长期持有的方法。尽管我不是中文输入法的专家,那不是我的专业强项,我只是 解决了有服务器存储的中文编码问题;但仍然觉得桌面中文输入其实是没有找到根本性的路子,目前的吹牛什么中文是世界上输入法速度最快的语言,完全是无知者 的自恋式吹嘘。

五笔的一个问题是字根字太难找,实际上尽管反复地使用,碰到字根字仍然是头大!打字速度经常在这里给中断了下来。这个问题 我现在找了 一个在线查询的编码网站,大概可以缓解这个问题。而另一个问题就是字编码太少,象“?"就没有!这是使用者最经常碰到的问题,所以五笔输入软件理论上应该 自带一个编码查找的工具,并允许用户自定义编码应对规则,但显然目前的五笔没有这个功能。

五 笔输入输入的另一个问题是输入字和词的选择。我的速度是极快的,目前计数是每分钟大约70多个字:这不算快,职业录入要求至少80个字一分钟;而事实上, 真正有一两年职业录入的录入员的速度也比不上我快,尽管她们的速度记录是每分钟120字。问题在于我打的是字,而不是词,如果我大量录入某一领域的词,那 么速度计数就可以轻松地提高一倍左右。而实际上五笔汉字不但重字,而且有大量的重词,重复的频率远远超过了字的重码率,以致于打词是一个不可靠的方式,甚 至很难做到完全不看提示框就进入通过词的输入。而对于录入员来说,词可以很长,特别是专业性的文章,甚至可以把一个句子作为词通过四码输入,但对于使用电 脑写作的人来说,出词的机率非常高特别是双码重词,一个作家不可能在思考一个句子能够预先提早十个字预计会有什么词,特别是习惯性用词。

我 的使用习惯表 明,打词基本上不能提创造性写作的速度但可以大幅度提高录入速度。我是极少直接打词汇 的,打词存在不少一唯一性,实际上降低了输入的速度,词,一般在不会打那个字时打入,而且一旦习惯打词,当词条不是每台电脑一样的话,就会大大降低录入的 速度。另一方面,对于不 用动脑的录入员来说,打词 是可以预计的,而对于象我这样高速打字写作的人来说,思考中涉及到的词在微秒级只是达到未来的一到两个字词,所以不可能在思考文章的同时预计会出什么词, 一旦预计打出的词没有如预期的出现,整个录入的速度就会大幅度下降。事实上,这反应出一种语言的要求:尽管汉语是以字为义的根元,但是实际上人的使用最通 常的方式仍然是以词甚至于习惯用句来思考的;由于五笔词的重码率高,就变得不太可靠,而字如果打得熟了除非少量的字根字难以迅速打出来,这是五笔的一个 缺点,那么直接打字的效率要比打词更可靠,也更快。这是下一代的输入法应该考虑这个问题,就是针对打词并且不应该与打字混淆。日语输入中的输出缓存可以考 虑的,这样可 以在最后通过一个识别码决定本次输出是字还是词。从本质上说,这也说明汉语的发现方向是演变成词义字元式的表达方式,才能适应文化电算化的要求。争论汉语 是不是最合适电脑处理的语言是无意义的,会混淆本质,令这种语言得不到进步。

升级的另一个要求是能够用一种输入法兼顾两种汉字编码,甚至三种,gb2312,gbk,gb18030,big5,作为一个大陆人不可能去学台港拼音, 更不可能学仓颉码;同样,要求一个台湾人使用五笔也是甚为难为。而在电脑中这是可以做到的,输入法编码其实是一个动态组合查字名的过程,而字体是一个显示 光点组合的16位数值,这由字库决定,与输入法无关。因此,应该是很容易办到的。

问题是用什么升级了,当前仍然是查找新的五笔输入法,它的要求是:第一不用钱,因为86就是不用钱基本上可以使用,如果要钱的话,意味着在一定时期后这个 输入法是得不到维护的;第二应该比86强,第三应该能输入繁体;第四是占用系统资源少,不是一个用我的资源拍我马屁提供一些无关紧要的功能的垃圾。

前两天花了半天时间几乎把几个现有的五笔方法装了一遍,结果,几乎全部淘汰了,只剩下一个不用钱的极点五毛和念青五笔是好用的??软件的事情就是怪,除了 微软ORACLE这样有长久承继性的软件外,几乎总是不用钱的软件比收费软件更好用的!感觉上和86差不多,它与念青五笔都有一个优点,就是与 windows的录入框架非常友好,不会自已另一起一套,凡是另起一套框架却对windows一窍不通的东西,几乎肯定就不是什么好东西,万能五笔就是一 例。

那个万能五笔是最垃圾的,不但功能最弱,而且最霸道,还设了一个木马把265设为首页。一些中国软件人为什么就是这么贱?桌面软件不赚钱目前是事实,但搞 这套就可以加以补偿了吗?区区一个输入法,不但占用了大量的资源还互相打架(因为超出了微软的输入法框架,那是一种游戏规则),而且还搞那么多小动作,我 干嘛要用它呢?把它用反间谍软件清除后,我不但永远不会用,还会永远禁止在公司使用任何万能五笔;而且永远不会访问265,而且永远建议投资者不要投资 265网,因为它的流量是虚假的。陈 桥五笔也是垃圾,不但要另外占 有大量的资源,而且还想时时要钱,真是一个垃圾的东西, 然后看来,凡是打算要钱的基本上都非常接近垃圾的水平。

念青五笔与微软匹配最佳,而且念青五笔可以实现windows/linux等平台的习惯通用,可以认为是86版王码的最天然的升级品种。在windows 平台上,极点五笔具有与念青五笔同样的占有资源少的优点而功能显得更为全面一点,所以windows平台选用极点,可能会比念青更佳;何况念青也是要钱 的,只不过不会太下流的方式要钱而已,而极点五笔,就开宗明义不用钱的??比王志民要聪明得多。极点五笔和念青五笔都对繁体有完整支持,所以繁简这个问题 初步看来是解决了的。

仍然花了一点时间在博客和广告上,杂事多,应争事也多;专家主页其实没有进展

今天抓紧时继续,博客和广告的事情要先扔到一旁,那那个东西是不能够天天看着的,而图片的能力也不是立刻就可以得到提高的,所以目前是差不得就放到一旁去 了。昨晚上本来是打算和老婆亲热一下的,但时间一下来,已经太累了,结果是睡觉了。由于猪猪跟新的保姆睡了,所以倒了睡得很有一点质量;只是猪猪已经一连 两晚哭闹着不肯睡,抬着头就去找妈找爸,不过也是不能不这样,道理上孩子应该自已睡的。

要开发一个主题的博客不是光是做一个博客就够的, 如果不打算别人知道的倒也无所谓,但是如果是打算有点价值的,通常就不是一个博客而是一批的博客,这也是 从安全考虑。期间也必然关系到包括主题、分类、版面设计和文章归理,广告设计,广告策略等。不是一个小量的工作,如果使用的是多个博客,就包括对多个博客 的评估,以及各个博客功能的运用等。

把 时间向前推上三天,从上个星期六开始,实际上有多半时间并没有集中精力到软件项目上,先是六四,然后是和Joan几个序旧,然后是五笔和博客,最后是广 告,而象昨天,基本上全天没有真正干过项目中的事情。除了这些相对来说也是正经事以外,实际上还花了大约有半天的时间查找关于战列舰舰炮发展关系的线索, 这是由于技术争论而起的业余课题。而今天是应该把精力回转到正经事上面了。说是没有集中,是相对于我原来的工作效率来说的,实际上在这么 多人当中,我干的事情还是最多的。

karran 发了几份简历给我,只是从这些简历上看不到什么有价值的东西,而见面本身则显得非常的浪费时间,因此我不太愿意就此花我的时间。等k上班后,就告诉她先去 了解一下他人的工资要求水平,以后也是这样处理就可以了。但马上回应是下载要给钱,这也是前面考虑的事情:目前网络招聘其实省的不是公司的成本,省不了多 少,而可能是扩大了可招收的面,并省了一点人事人员的时间而已。可想理想的网络招聘应该是一种可以让老板直接招聘的网站,可以针对性地搞成针对小企业的招 工网站。

这 几天把时间转向其他地方除了有作一次清洁积事的需要外,还因为要做的事情堆得太多,直觉是不可能在这段时间里完成的,那就需要静一静,或者断一断,以便 清出最需要的事情,而把成批的事情向后面推。如果不是经过这种思考而直接把所有的事情都postpone的话,那就意味着怠工了,这是一个非常核心的区 别。许多人不明白我为什么在需要把一件事情放下前,仍要花时间把它思考清楚,其实就是这个原因。

中午高又说科室修改用户组不行,记得这个已经解决了的,为什么又一次重新出现呢?其中一个原因可能是没有真正实现更新,但目前没有时间细看了,手工先把东西扔上去吧。

关于论坛:
论 坛显然是一个延续性非常明显的工作,无法清晰地摆出它的边界,事实上在操作的过程中存在着明显的功能上的扩展。象目前的qzys就是如此,它目前碰到的 不能短时解决的问题是回复和跟贴是无法简单区分的,而特约专家和非特约专家的回复也应该加以区分,这就不仅仅是简单的界面问题,而包括大量的版面修正和用 例探讨。对于统计来说,可以做到目前开始就分割回复和发?跟贴,但是从前的记录计数就变得无法再核准了,这样的意义也不是太大。总之,我觉得论坛的事情是 如果要处理的话,虽要在时间不是太紧的情况下细心整理,而不能预先定出处理什么什么项目??除非已经有完整的用例分析,否则这是不太可能做到的。而完整的 用例分析,目前没有其他人可以做到。结论是,向后推。

关于注册:
目前的另一个存留问题是注册方面需要让专家乐于注册,其中涉及到一个在线审查用户,而最接近的就是在论坛中回答问题时要求他填入更多的东西,不过,这两项都是不小的事情,更是需要详细的渐进式的考虑,所以,今天仍是需要把它向后面推的。

关于这个博客:
看 来,这个博客使用XML而不是数据库的一个好处是可以随读随入,而不必考虑这样会加重数据库的负担,这样对于使用者来说可以象在桌面一样习惯性地存盘,但 它的缺点是不能很容易地回到原来的地方,相比之下,blog-city就做到了。其实也是非常简单的,只需要在后台添加一个继续编辑就可以做到了。……其 实,我可以把这个连接连到博客项目上,然后直接进入编辑或者看到前台的效果的。

关于专家主页
这 三者与博客及专家黄页的关联和区别,实际上还没有考虑得非常清楚,但要在今天短短几个小时内推出一个版,看来也不能考虑得太仔细的,唯一 的办法就是直接让它可以打出文章。这就涉及到一个问题,文章本身,是否应该与原有文章放在一起?这个问题是考虑的。重新查找了一下以前发布的文章,当时的 结论是应该合并为一个表;看来这是有道理的,如果要合并为一个表就必须把这个表增加一个键值,使用多对多的键值显然不是一个好的办法。

下 午四点:www服务器好象再次出现了溢出,看来内存的设定仍没有到位,这是一个严重的问题因为,这个溢出是在已经有一段时间没有修改程序的时侯发生;其 次是溢出后没有恢复;第三是在溢出时实际上指示还有大量的内存空间可用,而为什么会溢出呢?那只有一个解释,没有充分使用到提供的内存空间。那换言之,就 算加大内存也无法增加负载容量,老实说没有什么比这个更麻烦的。发现有内存溢出报警是在前一两天就有的,与负载的关系并不是非常大,目前仍闹不准它什么时 侯会是内存会面临溢出。尽管这个是最重要的事情之一,但既然是没有什么idear也就暂时不去理它,仅仅是把使用的内存空间再次加大,看看结果如何。…… 记得曾经记下这篇文章的,结果在博客中国中就是找不到,相反,使用google一查,却查到了自已的那篇文章,很简单的,最后把xms加上去了,out of Memory的问题也就解决。这次可以看到内存统计上直接上到了1000M以上。

下 午傍晚时分,在博客中国上又花了两个多小时的时间,主要是放入广告和背景,并与blogger作一个对比,看看其在订制性上有什么差别。看来,博客中国 和相应的那个bloggerdriver以及csdn都有着同样的缺点,或者是同样愚蠢的地方,就是限制使用者组织自已的版面和广告,能够这样做的只能是 那些自以为高明的年轻小程序员,用我的话来说是够精明,太聪明;算来算去最后却是算了自已:用户博客如果自已不能赚钱,又如何能为收费博客付款呢?

实 际上,今天应答服务请求也占了我两三个小时的工作时间,以及为招聘而花的时间,其他电话也是接连不断,这就令我到了晚上仍不能真正开始那个专家主页的工 作;雪上加霜的是家中几盏灯也不能亮了,通常这意味着原来的灯的方案有问题,如果一盏盏地跟踪它,成本就太高了,有点受不了。

无 论如何,还是回到那个结构的更改上吧,由于文章决定是一个表承接多种类型,所以需要添加一种文章类型,同时,如果弄成一个多对多的表格的话,就意味着要全 部文章记录都 要更改,显然这不是一个好主意,还是使用集合类型吧。集合方面今天出了问题,我打算顺便看看它。发现了原因,但是其中一段看不出必要性。

晚上的时间主要google中的广告引到了一个似乎是异样的招聘猎头网站上,还作了登记;我希望这会对我考虑招聘网站有点作用。另外的时间就是解决那个 tomcat内存再次耗尽的问题 ,这个问题不解决,坐立不安。alexa的排名升了5000位,好象还没有更新?因为我记昨天还是这个数的,今天的数字 应该是周二的值。那么就应该是升上来的第二次才对??似乎还是这个值!

6/07/2005

拿到了google广告条,也发现这个博客可以改不少地方

今天早上仍然是早醒,仍然是再花了小半个小时查一查历史上208巡洋舰炮有什么特点,仍是不得要领,看来,应该是一种?助装填的整弹炮,不然无法理解为什么三十年代列强会专门打算造一级舰装这种炮。

终 于批到了google的广告条,但是原来拿来申请的网站太旧了,页面设计也不科学,一直没能太多的时间去整理,所以仅仅是把一个广告贴到首页,当场就让 整个网页变了型,不过也没有太多的时间去修整,等手头上工作告一段落后,就把那个网站重新做一次。而现在,首先看看把这个广告能够不能在这个博客上贴起 来。结果发现这个博客可以在模板填进各种各样的代码,这样就达到目的了,基本吧,如果知道它的对象是如何提取的话,可以做更多的东西,但至少目前是可以使 用了。而一来从laura那里拿不到广告帐号,二来这帐号也没有能够成功登录进去,三来更有趣的是google干脆就不能访问了,估计又是盖世太保干的好 事。

这 个极点五笔还没有找到不让它跟随光标的地方,总是会挡住输出界面,我是看作输出打字作文的,这样对我的影响还是比较大的。我打的是单字,使用词组如果是录 入没有什么问题,但如果是作文,单字比词组要好一点。但是我在本博客上调整了如斯时间后,却没有从渠道中发现有记录。换言之,我还没有把握,那个广告是不 是允许在多个网站投放的;或者只是在一个网站下的网页才允许进行投放,这是目前没有把握的事情。高岚的广告发给我后,却发现没有办法登录上去,不知是不是 给封掉了。而高岚本身是问过,同一个广告帐号还是可以在不同的网站发布的,库可靠见,我想还是要再搞一个帐号,以备急用。

念青五笔的感觉 与王码八六差不多,但支持GBK码,所以这样就可以把86扔掉了,如果念青不会另外收我的钱的话。上午尽管搞GOOGLE广告花了一点时 间,包括这个博客的调整,但另一个地方,那个早已解决的URL重写用到全科里也花了我不少时间,最简单的东西却搞了两个小时,最后好了也不知原来错在那里 (不可能错的东西),好象是有一点缓存的迹象在阿帕奇里,而不是完全按照规则填写进行重定向的。

不过,最后试来仍然不行,如果我把博客体在首页隐掉,那么连细页也不会显示出来,如果显示细页的话,就必然显得长得不得了。……整一天大部分时间,包括晚上,都是在学习如何使用这个blogspot的博客,它的调整模板项倒是不太 难,只是模板逻辑显得单一基本上掌握了。

于公而言,这是在了解一个博客应该有什么功能,以前他人的功能做到了什么程度;于私而言,是希望让这批博客发挥出它的应有价值;而当前是由于得到一个 GOOGLE帐号后,想看看实际运行效果是什么。没有图片的话一个网站显得太单调,因此下载图片的时间花了不少,尽管已经严格限制了。secure的网站 格构太差,这是之前的美工水平太差所致;我处理图片的能力太弱了,看了,这些相当于自已的网站,如果不能自已处理图片的话,是玩不下去的;至少是玩不好 的。

6/06/2005

把五笔都装了一遍,只有极点五笔还可以用,最垃圾是万能五笔

早上很早起来的,开始做到要修改dao.xml中member,便联想到要把dao.xml的读入方式升级,以及相应的解决方案,但打日志时更觉得五笔不 好用了(打了十年了,越来越觉得它不好用了),心血来潮要装98试试,这是第N次了,前面装上去总是不好用最终删除。这是最后一次吧,感觉98推出后五毛 就完蛋了,王志民是一个笨蛋,完全不理解输入法的使用习惯比稍作笔划优化是更重要的选用因素。更糟糕的是,98不能用,(编码完全不对,难道重学一遍 吗?),而86也失踪了,连重装也装不上。最后重启再装,上去了(估计刚才是内存耗尽所以装不起),发现原来写好的日志也没有了。幸好不算多。

所以五笔的升级是需要的,问题是用什么升级了。更新了一个极点五笔,感觉上和86差不多,而且暂时还不知道如何录入词汇呢!而实际上我是极少直接打词汇的,打词存在不少一唯一性,实际上降低了输入的速度,词,一般在不会打那个字时打。……

又 一次?掉了?入的文?;那??能五?看?是罪?之首,?能是?不能!垃圾的?西,把它?除清光後保留了其他??五?等?入。把它?除了,??在桌面上留下 了一?copyso的什??西。瞧在它好象?挺安份,我也一??有??理睬它,就?它呆著吧!另一?五?快打要????倒是不?,但瞧?付德性也?有什? 出?的地方,大把替代品,我?嘛花??不可靠的?西呢???版找???都?得找,就把它?除了。反正我的原?是要?的就不用。?次的五?安?花了我?? 小?,才回到正?上。

从检验效果上看,上述文字不但在客户端成为问号,读回来也成为问号,原因可能与blogger.com使用的是 xml的存储有莫大的关系,由于XML文件有编码设定,因此,这就与先前的乱 是同一个原因。而对于新的读回,也是使用如java这样的方案读成字节流,当然也成为乱码了。但是我对于汉字编码的内在原理还是不太清楚,这个问题不搞清 楚,要做一套文字两套语言就不是那么容易的一件事情。

今天的alexa排名掉下来了,理论上这是周日的排名,还有更麻烦的事情,那个万能五笔设的265仍然霸占了首页,仍是不能把它搞掉,这显然是一个间谍软件。咱们一些中国人就是这么一副缺德性。

6/05/2005

星期天,半天有多花和朋友的叙旧上

晚上受猪猪的干扰太大了,一直睡不太好,因此早也容易醒。昨天晚上刷新了一晚home,不知有没有效果,这要过两天才看得出来。那部生活记录弄着弄着,变 得仿佛成了成人小说似的,原来是如此花时间的。把qzys最后的部分整理完毕,没有发现有什么问题,但当把head.jsp修改后由于每个jsp都是包含 它的,结果却是全网一下子变得特慢,大概是因为所有的模板都要重新编译一次的原因。

晚上到十二点近了,仍没有做到hzbbs中的最关键修改部分,如同昨天还是前天一样,这一部分不是小东西的,反正居居一两个小时肯定做不完,还是等到明天再做吧。

那个alexa排名掉了下来,是一万多一点。不过相比上一个星期,算是掉得少得多了。看来刷新还是有用的。