• 中文wikipedia的一些用户数据

    by shizhao 发表于2006年11月21日21:31:09 | Tags:Wikipedia Web2.0 用户

    wikipedia最近一次的各项统计数据(这个连接可以直接访问,不用带套)在11月21日发布,该统计数据来自10月31日资料。

    其中的一些用户数据实在不容乐观:

    所有注册的用户中,每100个用户只有大约11个用户会进行至少一次编辑。也就是说,大约89%的注册用户只是注册,从来没有编辑过。或者说,注册用户目前有143,596,却只有15,765人真正编辑过。而这15,765人中,只編輯過1至2次的維基人已佔7786人(49.4%)。

    简单算一下:15765-7786=7979

    基本上可以说,真正对wikipedia有一定程度了解的中文使用者,最多不超过8000人。虽然还有很多人一直非常关注wikipedia,但是说实话,只是在旁边看,从来不去实践一下,很难会真正了解wikipedia的社群文化甚或wikipedia的精神,也很难全面地了解中文wikipedia的整体文章质量。因此许多像这种对于wikipedia批评的文章来说,wikipedia社群是根本不以为然地。

    但是上面的数据倒是精确的验证了Putting people first提出的一个1%规律:”如果一个群总共在线100人,那么将会有1个人新建内容,有10个人回应(评论或者修改补充),而剩下的89个人只是浏览而已。”

  • 用SSH穿透GFW(转载)

    by shizhao 发表于2006年11月21日15:50:24 | Tags:SSH GFW

    这篇文章转载自http://yesure.blogspot.com/2006/11/ssh-tunnelfuck-gfw.html

    主要是为了防止vblogspot不能访问的时候,自己能够容易找到,作者Wisi

    SSH Tunnel之fuck GFW整体解决方案

    在不能使用代理服务器或者tor绕开防火长城的场合(比如单位里面不可以使用非企业代理,比如日后tor被土共封锁),如果ssh 22端口没有被封锁,那就可以利用OpenSSH强大的tunnel功能来
    实现高速安全的访问Internet任意开放网站的任意开放端口 。在这里简称挖地道

    1准备条件:
    1.1 某国外主机shell,这个需要你自己去找,买一个或找找一个免费的,需要上面的开启sshd
    1.2 Firefox浏览器配合foxyproxy扩展,虽然用IE也方便,但是当大多数网站不需要挖地道访问只有个别网站需要挖地道访问自己又是懒人懒得每次访问blocked网站去切换浏览器的代理设置的情况下,用foxyproxy这个基于模版自动匹配代理的扩展还是很方便的。
    1.3 国外代理服务器,任意一个高速匿名免费代理服务器

    2原理:
    2.1首先man ssh,注意ssh的manpage里面这也一个选项:

    -L port:host:hostport
    Specifies that the given port on the local (client) host is to be
    forwarded to the given host and port on the remote side. This
    works by allocating a socket to listen to port on the local side,
    and whenever a connection is made to this port, the connection is
    forwarded over the secure channel, and a connection is made to
    host port hostport from the remote machine. Port forwardings can
    also be specified in the configuration file. Only root can for-
    ward privileged ports. IPv6 addresses can be specified with an
    alternative syntax: port/host/hostport

    2.2基本格式

    ssh -l USER -L local_port:any_host_blocked_by_gfw:the_blocked_hosts_port ssh host_which_out_of_gfw

    这样任何被屏蔽的主机(any_host_blocked_by_gfw)的任何端口(the_blocked_hosts_port),就可以在本机127.0.0.1的localport访问了

    2.3解释,这里有好几个host不要搞错。
    ssh -l USER是你用来登录目标ssh主机的用户名,ssh就加上一个-l选项
    local_port:本机的某端口,最好大一些,保证没有被其他程序占用的,以后被屏蔽主机的某端口就被映射在本机的此端口
    any_host_blocked_by_gfw:任何一个被gfw干了的主机,比如zh.wikipedia.org
    the_blocked_hosts_port:前面提到的被干了的这个主机的某个端口,比如25 23 80
    host_which_out_of_gfw:任何一台不在土共的GFW范围内的一台ssh host

    2.4例子:
    ssh -l fuckGFW 8088:zh.wikipedia.org:80 fuckgfw.free.com

    我用fuckGFW帐号登录fuckgfw.free.com主机,并且把维基百科中文的80端口映射到本机的8088端口,这样下次用http://localhost:8088来访问维基百科

    3应用:
    每次去挖这样一个坑麻烦了点,这时候就要动动脑筋想想别的办法了。普通的代理服务访问国外主机虽然会被土共的gfw盾,但是,如果把普通国外代理服务器加上一个ssh的套套,那土共的GFW就煞笔了,而且即使土共把这个代理服务器本身干了也没用,因为我们的国外ssh host和国外的代理服务器都是在GFW之外的,那就是终极解决方案:
    用ssh tunnel给国外代理服务器加套
    例子:
    ssh -l fuckGFW 3128:proxy.anywhere.com:8080 fuckgfw.free.com
    这样就给国外的代理服务器proxy.anywhere.com加了套,然后在本地的浏览器设置代理为localhost:3128,那么只要你到fuckgfw.free.com的连接是22端口的ssh加密连接,土共就对你的内容无可奈何。
    至于fuckgfw.free.com和proxy.anywhere.com之间是不是加密的会不会监听,目前看来似乎是不加密的(否则我在防火墙内我的本机开一个ssh再加上一个squid就可以访问任意国外主机了),所有这样做还是有风 险,千万不要用这样的方案访问你的paypal帐号gmail等等。但是用来绕开防火墙,正常使用google是足够了,访问blogspot wikipedia等等也没有问题。

    4.To Do
    通常网上容易找到的代理服务器都是只支持http的,支持https的还没有找到,所以访问https的内容比如gmail还是没有好的解决方法,目前只能设置一下foxyproxy直接访问https的内容(或者用tor),还有一个办法就是再挖一个通道,把gmail的pop服务器的端口和smtp直接映射在本地的某端口,宁可暂时放弃一下gmail web的丰富feature,也要不受限制的访问google的服务。注意,在ssh到一台主机的时候,可以同时挖n条隧道的,也就是可以在ssh命令后面加上n个-L 参数

    5.补充
    使用windows操作系统的也可以用此方法,putty对ssh的tunnel有完美的支持。
  • 外交部也知道wikipedia了

    by shizhao 发表于2006年11月16日22:54:05 | Tags:Wikipedia 外交 GFW

    更新1:看来GFW最近在闹脾气,总是变来变去的。今天欧洲的代理可以使用了,但是不能上中文版,可能zh.wikipedia.org又成了关键词

    更新:最坏的事情不幸被我言中,从今天早上北京时间9点多以后,所有语言的所有wikimedia项目都被封掉了。这次还封掉了欧洲和美国的代理,https的访问也仍然被封锁。目前恐怕除了tor以外,别无他法了。

    今天在外交部的例行记者会上,有记者向外交部发言人姜瑜问到了有关wikipedia的解封问题:

    问:此外,去年10月以来一直被封杀的维基百科中文网站上周得以解禁,你对此有何评论?

      答:我不清楚你提到的具体网站情况。中国政府积极支持和促进互联网的发展。截止2005年,中国上网用户已超过1.23亿人,中国网站数量达78.8万个。中国已成为世界第二大互联网国家。我们依法对互联网进行管理,这也是世界各国通行的做法。

    也不知道这是哪位记者?这样问外交部。这下子外交部也知道wikipedia了,不知道对wikipedia来说是好事还是坏事?

  • 中文wikipedia解封后的变化

    by shizhao 发表于2006年11月16日02:22:10 | Tags:Wikipedia GFW
    中文wikipedia10月10日解封之后,终于重现大陆江湖。Andrew Lih在10月13日经过一些数据分析发现,这几天中文版的注册用户增长速度已经达到了所有语言wikipedia的第二名,仅次于英文版(中文版条目数位居第12名),而条目增长比以前多了75%。由此,《华尔街日报》特别撰文,喜称“维基百科中文网站人气飙升”。Andrew Lih同时还提出了对“中国为何解封wikipedia”地分析。

    以上一片令人欣喜地消息和评论,却都没有注意到中文wikipedia社群为此受到的负面影响。

    下面这个图表是11月5日到11月14日之间中文wikipedia上每天所删除文章的统计(取解封前5天河解封后5天的数据,后面的图表皆同)。解封前平均每天有82.4次删除操作;解封后增加到了109.6。

    deleted in chinese wikipedia


    这个图表则是每天提交删除文章数量的统计。解封前平均每天有14篇文章提交删除;解封后增加到了20.4。

    vfd in chinese wikipedia

    这个图表是每天提交侵权文章的统计,解封前平均每天发现17篇文章侵权;解封后增加到了39.4。

    copyvio in chinese wikipedia

    最后是对这三种wikiepdia上最多维护的情况在解封前后的比较:copyvio增加了132%;vfd增加了46%;deleted增加了33%。


    zh

    其他一些对破坏性的编辑地维护,由于数据收集不方便,因此没有比较。

    每次大量人流的涌入,虽然对wikipedia的推广具有莫大的好处,但是由于新人不熟悉规则而带来的维护上的困难,每次都令人手忙脚乱。(例如以前一塌糊涂BBS关闭的时候,也遭遇了同样的问题)

    wikipedia的日常维护完全是依靠热心参与者的手工操作,而且wikipedia不同于许多用户提供内容的站点是,它对于文章的要求非常高,因此新人的大量增加对于人工成本影响非常巨大。

    但是依据以前的经验,经过一段时间,对于wikipedia的新鲜感一过,真正能够坚持下去,把握wikipedia精神的,总是少数。

    但愿我这是杞人忧天....
  • 今天你投票了吗?

    by shizhao 发表于2006年11月08日12:58:13 | Tags:FLICKR vote 人大代表 弃权

    今天是北京区县、乡镇两级人民代表大会代表换届选举的投票选举日。此前热议的“民选代表”似乎已经销声匿迹。我所在这个国企单位的候选人是一位单位的领导,虽然我知道他,但是并不熟悉,作为候选人完全是单位的安排。

    这个神圣的一票我选择了弃权。虽然大家都知道民主权利的可贵,但是大多的平民百姓仍然只是走走过场,很难说得上是珍惜。至少我认为我的弃权要比走过场的投票要更为珍惜自己的权利。

    多的不说了,再说徒惹烦恼。倒是flickr blog也来凑趣,刚刚发了一个“I Voted”的帖子:

    I Voted - day 4 My Every Day (2) I Voted The Democratic Process is Progress 1107060927.jpg I Voted ... Did You? I Voted I Voted. I VOTED! Did you? ivoted Vote! I voted Read the sticker I voted Pat Paulsen For President I voted! I'm a Georgia Voter 365 Days (009) Vote Have you? To the left I voted today 20061107T102242

    Photos from British American, lorilea, earthdog, a modern girl, juverna, outdoor_type, phlewght, iandavid, Daniel Morrison, cin-dicated, =sm=, Michael™, JeanC38, trekkyandy, moogocow3, Happy Trails To You, nerdboy, CliffLandis, Susan Groppi graceful.spoon, olivander, LexMonkey, kakul and Ben Brown.

  • 如何烧制我的网摘?

    by shizhao 发表于2006年11月02日21:46:43 | Tags:Feed cnbloggercon RSS

    年会上,Aether说我的blog的feed上烧的bloglines的剪报需要点多次的链接才能打开原文,很让人郁闷。其实我也知道这个问题,但是目前我用bloglines对于我来说最方便,可以直接烧进rss,del.icio.us的方式我就要麻烦一点,多点几次鼠标,而且blogbus的API不支持。365key的方式我又嫌麻烦。

    不知道还有什么服务可以实现我的需求呢?或者我还是麻烦一点用del.icio.us?

  • 遇到金钱公关的blogger

    by shizhao 发表于2006年11月01日12:57:38 | Tags:blogger公关

    2006年8月,某blogger揭露的外发加工骗局,昨天接到电话请求删除该篇blog,并且提出可以用一定的金钱来作为交换。金钱与道德的较量,在blog上正式展开。

    这里(12)有原始的电话录音下载。

    搞笑片段:

    XX: :每个月汇800块?我这边也会有这么多吗?我这边删除也会得到这么多报酬吗?(嫌多吗?)
    骗子:啊500块行不行?(真奸)
    XX:我不太熟悉这个行情啊,能不能……
    骗子:你说,没事
    XX:我的一年的网站费用才...才..才..几百块钱,如果能昨到这么多报酬也不错了(安慰自己)
    骗子:对对对。另外,两家公司一起算,也就1000块钱咯(为啥不只给五百)
    XX:啊……
    由于当事人要求所有文字和音像,保留部分权利,要求不署名-不提供来源,允许派生,允许商业使用,也允许非商业使用。如果不明白,请搜索一下就能知道原委。
    PS: 这里有骗子公司的详细情况。