淘客熙熙

主题:【讨论】鲁白提到的这些科学上的不正当行为,怎么处理? -- pkhelen

共:💬24 🌺47 新:
分页树展主题 · 全看首页 上页
/ 2
下页 末页
  • 家园 【讨论】鲁白提到的这些科学上的不正当行为,怎么处理?

    看过穿越大侠写的鲁白自白

    http://www.ccthere.com/article/3007975

    觉得受益匪浅,又紧巴巴地看了鲁白其他的帖子,觉得很有意思。

    尤其这篇,科学上的不正当行为(剧本)

    http://www.sciencenet.cn/m/user_content.aspx?id=332968

    给了一个剧本然后提出几个问题供大家思考,讨论。

    但是很多问题我不知道怎么回答。虽然每年参加学校的ethic training,但都是提醒自己不要越界.

    但是作为同事或者老板,发现共同作者或者组里有人造假该怎么应付呢?有没有规定条文可以具体参考的?

    如果各位牛人大夏天有时间,能否讨论一下?

    • 家园 看了那个剧本

      基本上对邓巴的处理是中规中矩的。邓巴最大的问题就是存在明显的主观上的修饰数据,光这一条就犯了科研上的大忌,所以被赶出科研队伍也是必然的。

      首先要讨论的是使用photoshop的尺度。现在大概所有搞科研的人都接触过photoshop。在非常老派的实验室里,是不允许任何修饰数据的。但现在大部分实验室里还是允许合理尺度的修饰的。比如说,可以用crop把一张图中无关的部分切除掉。甚至两张照片的拼接也是允许的,前提是用虚线或者其他标记让人一看就明白这图是拼出来的就行。用photoshop调明暗、反差也是可以的,但是需要在整张图上调,不允许只调局部。总而言之,可以用photoshop修改图片,但要让人能意识到图片是做了哪些修改,尽量标识清楚。

      其次是实验记录。说实话看到那部分我出了点冷汗,因为这几年我实验室逐渐变懒,大家都喜欢用电脑储存原始数据,比如说一个excel表的数据就直接存在电脑里。图也都是存成JPG文件。勤快点的人处理完数据后会打印下来贴到记录本里,懒的人可能连这个都不做。所以要是我实验室发生伪造数据的事,还真不好查。所以这会是一个棘手的问题。

      如果逼着那帮懒人用老式方法写实验报告,估计会有不少不满情绪。也许我可以让每个人把他们的数据、电脑里的实验记录做成PDF文件,每周给我e-mail过来。我自然不会一一查看。但一旦出了什么事,这些PDF就是最好的证据。因为它的每一页内部都不能修改,而文件本身有日期等信息,比较可靠。

      不过最重要的还是我一直有的一个观点,就是不要做太难出成果的东西。宁愿不要出大文章,也不要把人逼到绝路上,让人干冒奇险去造假。大部分人还是有理智的,能掂量出风险和收益。

      元宝推荐:海天,游识猷,
      • 家园 有个现成的系统可以用

        专业术语叫ECM系统,具体软件叫documentum

        做版本控制,访问和修改权限,BPM(bisiness process management)等等,相当强大。

        缺点一是贵,一个授权得要几万到几十万美元吧

        二是开发过程很复杂,一般都得要找服务外包公司做开发和配置,项目一般三五个人干三到六个月。

        优点是太强大了,比如空客用它来管理飞机设计制造的技术文档,一些药厂用它来管理制药过程的文档什么的。全世界的几万人共同访问几十万几百万的文档井井有条。文档编辑修改访问的记录全部可以查询保证安全。

        有兴趣的话,嘿嘿,我们公司就是做这个的,项目开发收费相当便宜(我们公司客户说的),大概只要600欧元每人天。

      • 家园 这个技术上有问题啊

        俺也是做生物出身的,可以理解....不过这段话

        比如说一个excel表的数据就直接存在电脑里。图也都是存成JPG文件。勤快点的人处理完数据后会打印下来贴到记录本里,
        现在越来越不显示了,譬如数据,来个screen一动就是几万到几个亿的数据点,切不说打印出来是否环保,实际上有意义吗??...... 图?,3D的呐? 或者分层扫描的呐?(譬如confocal的)..... 大的图动辄几百MB,一套下来几个TB的图像都有,打印,贴? 这个得专门雇个人干了.....所以,digitize是不可避免的

        俺认为有些东西,作为老板要有足够的手段去检验....甲做的实验,乙丙丁都要能重复.....否则,缓一缓.....有些实验换一个方法要能证实,能验证.....

        • 家园 我当时想的是spectro的某些读数,做成excel

          不到一页纸的。

          对付造假大部分人就是看看数据跟文献中已知的东西是不是能make sense.科研虽然说是创新,但创新不是凭空掉下来的,都不会真正的匪夷所思。所以有的时候common sense很重要。多和同行讨论,太奇怪的东西就要小心了。

      • 家园 用PDF除非使用签名,因为PDF本身是可以修改的。

        防止数据被篡改,最有效的办法是使用电子签名,不过成本太高了,而且一样面临同样的质疑。毕竟电子签名的认证机构不是政府,就算是政府同样会被质疑。无论是文件时间,还是其它,说白了都是数据,只不过一般人不会想到去修改而已。

        如果打印的话,天量的数据都打印出来肯定是无法接受的。

        我觉得比较可行的方法是对数据文件作校验和(checksum),最后把校验的结果打印出来存档。当然就算这样,也保不了十年二十年后算法被破解。所以最保险的是过一定的时间就升级算法,重新计算校验和并打印出来……

        • 家园 PDF可以加密,限定可以打印还是编辑

          好像可以用DES128加密,可以限定是否允许编辑,或填写表格,或评论,或高分辨率打印,或低分辨率打印,或copy/paste等等不同权限。

        • 家园 电子签名其实是个好办法,没有必要有机构认证

          穿越和他的手下每个人自己生成一对比如RSA的公密钥,把所有公钥公开,无论谁都拥有所有人的公钥,私钥当然得好好保存,千万不能给谁偷了。

          如果某人做了实验,得到数据或图片,全zip在一个文件a里,有必要的话里面有个txt文件作个小说明,比如时间人物啥的都可以写上。然后某人拿自己的私钥把这个文件a加密变成b,然后寄给穿越。穿越拿此人的公钥把b这个文件解开看到zip文件a,确认里面的东西没有问题后,用自己的私钥把b加密变成c,然后保存c,还可以把c寄回给某人,如果他愿意的话也可以保存这个文件。

          这个c文件只有某人和穿越共同合作才能产生,但是任何人拿着某人和穿越的公钥(这两个公钥谁都有)以及c,都可以查看a文件里面到底是什么。

          以后有伪造数据的嫌疑了,拿出c来,谁都能检查里面的原始数据是什么,但是某人不能说那是穿越伪造了c来陷害他,因为用穿越的公钥解开来的b是除了某人外没有人可以产生出来的,而穿越也无需担心某人在以后伪造一个c'文件,使得里面是被改过了的a'文件,因为事后某人的确可能伪造出a'文件,然后拿他的私钥产生b'文件来,但是没有穿越的私钥,没办法得到那个假的c'文件。

          这其实就是电子签名,无须公证机关。当然私钥怎么管理又是个问题,如果让人偷跑了那就又完蛋了。

          • 家园 这种方法一般是用于验证加密者或者签名者

            的身份,文件生成时间的生成时间还是很难被核实。

            我是这么看这个问题的,就是数据是何时由何人在何处用何种方法产生的。这里包括了数据本身的真实性。完全验证这几样是个非常复杂的过程,重要的是要独立地对这几个要素进行验证,数据本身需要和时间这类信息分开对待。当然这样必然导致整个过程极其复杂。所以,我只是简单地在校验数据自身的同时,保证数据生成时间可以被核实。

            如果要完美的话,不光是经手的人员,还需要给每个生成原始数据的程序(即数据是由何种方法得到的)指定独立的公钥/私钥对。在这里,我们应当只使用私钥来签名,生成一个摘要,再由公钥进行认证,而不对数据本身进行加密。最后自然是时间戳的问题,目前的时间戳认证可以用授时中心提供的方案,也可以由一个独立的程序通过授时服务得到标准时间后,再进行一次签名。当然技术上仍是不对称加密。

            最后是公钥的真实性,我的建议还是把公钥打印出来,然后放在保险箱里……但如果要证明自己的清白,还是必须上传到一个有公信力的服务器上。简单地说就是在公钥/私钥对生成以后,将公钥交给独立第三者保管。

            经过了这几重保险以后,再加上升级大法,理论上应该是万无一失了……

            • 家园 时间就写在一个txt文件里一起打包

              反正大家都要看一看里面的东西是否对头再签名的。

              如果是要在法律上有效,当然得象你说的这样大费周章,如果只是为了防范于未然,那就不用公证了,把公钥弄得尽人皆知就行了。再怎么说也比弄一大个PDF好吧。

          • 家园 天啊,看完后我已经晕了。真是隔行如隔山!

            这么深奥,简直要崇拜了。

            • 家园 其实他们都是想的太复杂, 把你的手下当成超级黑客来防

              你手下有没有超级黑客不说, 就是有,你也可以用多重备份来防. 你学校的IT部应该不是吃干饭的. 第一总实验数据库要备份(日备,周备,月备..), 第二电子邮件服务器要备份, 每周job report要pdf发到你的邮箱. 这些都会留下纪录,转到备份里. 第三就是你的个人备份. Outlook有auto forward, 自动搜索关键词转到gmail之类的个人邮箱. 有人要改他要去修改三个不同服务器的备份和纪录, 而且还不留痕迹.有这本事他早不用在你这里混饭了.

              开始两三个星期抓紧点, 养成好习惯. 剩下的就都是机器的事了.

分页树展主题 · 全看首页 上页
/ 2
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河