纪录片之家.十八岁

标题: ABOUT《中国图书馆分类法》 [打印本页]

作者: adyu    时间: 2009-8-8 10:08
标题: ABOUT《中国图书馆分类法》
就我的認知, 所有的圖書館分類法都是類似的做法,分類...決定出一本書(VIDEO)的唯一編號. 出一本書(VIDEO)的名字只會出現一次, 所以大家必需先去了解圖書館分類法,才能順藤摸瓜, 找到書(VIDEO).
但是小家wiki的分類不同, 書(VIDEO)的名字會出現在每一層的分類目錄裡.

拿 食肉目 做例子說明,
在中国图书馆分类法裡 分類是Q959.838, 影片名只會出現在”食肉目”的分類下,在”哺乳類”,”動物”等分類下是不會有 影片名的.
而在小家wiki的分類裡,影片名會出現在”食肉目”,”哺乳類”,”動物”等分類下

----以上如有錯, 請更正--------

HI 我想可以這麼做

1. 姐姐爱小小 先挑2,30 個片名試做分類,結果用HTML的表格呈現(要有分類編號,影片名).到時候我再放到WIKI上
2. 我再補充幾個片名, 請姐姐爱小小 再編(主要是增加測試的涵蓋範圍)
3. 討論呈現的方法, 簡單版就是,請姐姐爱小小在 ”影片原始規格:”下再多加一行中国图书馆分类法的分類編號.
作者: 姐姐爱小小    时间: 2009-8-8 20:48
“ 先挑2,30 ”是啥意思?
HTML的表格呈現我不会做啊~~~
让我做哪些?你给我个链接好吗?

另,你所举的例子·~
在分类里~~这样的情况很普遍·~
对于现在很常见的交叉学科~~~分类法通过“参见”赋予一本书两个分类号~~
在图书馆检索系统下·~~任何一个分类号都可以查到这本书~~
也就是说·~~不是一本书只有一个分类号·~~

各个馆根据读者情况和馆藏情况·~决定哪个做第一分类号~~
如:《高血压防治常见问题》这样的书~~在综合性图书馆可能先分编到内科学下·~
但是在专业医学馆~~~很有可能先分编到保健之下

[ 本帖最后由 姐姐爱小小 于 2009-8-8 20:59 编辑 ]
作者: nideyingzi    时间: 2009-8-8 21:09
这个 图书馆分类 很专业很科学,非常细致,

但要考虑到WIKI的现实情况,
在WIKI编辑片子的时候,不可能每部片子都是看过才编辑的,
更多的是依靠影片本身的内容简介来归纳条目,
有的内容介绍翔实,有的只是一笔带过,
所以编的时候只是尽可能的准确,
很多片子并不清楚有无遗漏的条目未归纳,
所以能把条目修的更完善固然是好事,

更多的校准 工作,
需要大家一起的努力,去投入精力热情去修改,补充。。。。
作者: 姐姐爱小小    时间: 2009-8-8 21:19
标题: 回复 3楼 的帖子
难道你认为图书馆的人是看过书之后再做编目的吗?

图书馆的编目体系之所以好用~~除了分类体系之外~~
还在于它可以就文献的内容、外部形态等若干特征~~~编制出若干字段~~
字段越多·~反映图书的信息越详细·~~用户查询越方便~~

如果一本书只有题名和作者字段~~~找到他就只有两种方法·~查询是很不方便的
但是现在的图书编目·~~大多数书都有20个以上的字段~~~
这就是查询方便的原因

[ 本帖最后由 姐姐爱小小 于 2009-8-8 21:23 编辑 ]
作者: nideyingzi    时间: 2009-8-8 22:01
原帖由 姐姐爱小小 于 2009-8-8 21:19 发表
难道你认为图书馆的人是看过书之后再做编目的吗?

图书馆的编目体系之所以好用~~除了分类体系之外~~
还在于它可以就文献的内容、外部形态等若干特征~~~编制出若干字段~~
字段越多·~反映图书的信息越详细·~~用 ...


我只是在阐述我编辑片子时遇到的实际问题,
请不要推测我的意思。
版主说得对,
找部片子按照你自己的想法编编看,
将你的想法化成实际的文字展示出来,
这是最好的方法。

[ 本帖最后由 nideyingzi 于 2009-8-8 22:14 编辑 ]
作者: swing116    时间: 2009-8-9 00:21
原帖由 姐姐爱小小 于 2009-8-8 20:48 发表
另,你所举的例子·~
在分类里~~这样的情况很普遍·~
对于现在很常见的交叉学科~~~分类法通过“参见”赋予一 ...


我补充一下
关于“参见”,指的大概就是“互见”吧?
就是指一本书有多个分类号。一般一本书只有一个索书号,找书就找一个地方就行了,但有的书是交叉学科,例如《计算机英语读物》,可以归到 英文读物H319.4,也可以归到 计算机TP3,为了两个领域的读者都能查找到,可以采用“互见”的方式,也就是在H和TP这两个地方都放有这本书,而计算机机读目录里也容许一条图书记录有两个分类号。
不过要用互见的情况一般也只有两重互见,最多的我就见过三重。当然,那将是一本书书脊贴的号和它归属的书架,不可能给太多,所以分的时候还是得慎重,不可能像给标签、给关键字那样随性和多样。不过话说回来,如果是用关键字或题名之类查书的话(而不是用分类号查),无论放在一个大类还是两个大类,照样能找到这本书,况且一本书也很少跨那么多学科的。

关于WIKI的呈现方式(一楼),楼主的意思大概是,如果《计算机英语读物》给它分到H319.4,那么除了在H319.4以外,在H319、H31、H3、H下也能直接见片名吧?
如果这样,那么分类时的一个难题,分类细致到的层次,就不用又考虑细致度又考虑查询率地左右为难了。一分就分到最细就OK了。
找片者需求明确的,可以直接找分类法最细的级别,出来的片子列表很短,可以很快找到需要的;需求不明确只有个大概方向的,可以找大一层的类,琳琅满目花多眼乱一下,也不会漏掉哪一部。
上述的互见,WIKI系统应该也可以做到吧(一部片在此分类列表里出现多次,只是链接的指向和标识问题,应该没有唯一性要求吧)?应该问题不大。

关于著录,我想我们在小家down到的片子,信息都是有限,不能像拿在手的正版图书有CIP有ISBN有版权页甚至有赠送的marc那样信息完整。不过一般发片时简介都有些可用信息吧,例如类型、片名、语言、字幕语种、年份、厂牌、持续时间、内容简介、码率等等,可以用,虽然各类片源这些信息很不齐整,但片名和链接总是有的吧,那么就这俩作必备字段,其他都作可选咯。建议小家给大家发片时定个格式,有效格式才能加分。。呵呵。
……猛然发觉,楼主的意思是不是不另外做片目,而是直接把片名塞到WIKI分类法某类目的页面下,然后片名链接就直接用在小家发片帖子的链接。。?那么关于厂牌、码率、视频格式、语言、字幕语种这几个明确、可做索引的信息,可否由用户发帖的时候填写相应的表单自动实现(如果分类由专业人员来做的话)?抱歉,我真的对WIKI跟论坛的结合程度没什么了解过
作者: swing116    时间: 2009-8-9 00:36
给个比较完整的中图法类目详表
http://202.196.16.22/clc/index.asp       树式列表式
http://www.lib.sjtu.edu.cn/view.do?id=516       超链接页面式
wikipedia也有列表,但没有这两个详细.我对比过了
作者: adyu    时间: 2009-8-9 08:30
事情都還沒講清楚, 別先爭吵, 都是我表達不清, 好像事情都亂了套了.
=====================================================================================
重新來說一次.
1. 因為我跟阿聚對《中国图书馆分类法》 不熟, swing116,姐姐爱小小2 位又對wiki 的分類不熟, 第一步就是要先用小家wiki 現有的影片依《中国图书馆分类法》分類, 做個測試, 看實際有那些問題.

2. 麻煩 姐姐爱小小以 Leopard《花豹》為例編成中国图书馆分类法的目錄.
表現形式, 你方便就好, 另外, 再請編一下這個"大多数书都有20个以上的字段"
我覺得 或許姐姐爱小小所說的"大多数书都有20个以上的字段" 跟wiki 的分類目錄是很類似的東西.

然後我們再討論
作者: 姐姐爱小小    时间: 2009-8-10 21:16
分类号:
    Q959.838     哺乳动物食肉目 (含有Q959.8,就表示他已经在哺乳类之下了)
    Q958.15+5   动物群落分布  

以下是根据楼主提供的链接信息做的机读信息和相应的含义

100    ■a1997
          1997年出版发行
      (此字段内容根据书籍与纪录片发行方式的不同,做过简化)

101 2  ■a英语■c英语
      原语种英语,现在还是英语,但附有字幕

102    ■a英国
      出版国英国

200 1  ■aLeopard ■f导演姓名■h4
           题名Leopard,导演为XXX,系列中的第四集

210    ■a英国■cBBC
           出版地点英国(或某城市),出版者BBC

215    ■a00:46:11■c624*480■d699M
           时长00:46:11,分辨率624*480,大小699M
         (此字段内容根据书籍与纪录片载体形式的不同,做过更改)

225 2  ■awildlife specials■fBBC
           本片属于BBC的wildlife specials系列

305    ■ahttp://www.verycd.com/topics/91947/
          下载地址http://www.verycd.com/topics/91947/
         (此字段根据书籍与纪录片来源方式的不同,做过更改)
      
306    ■aBBC 中央电视台
      假定存在联合出版现象

330    ■a人类对非洲猫科动物中花豹知之甚少。直到现在,花豹,这种夜行动物几乎不可能被人类所了解。本片在拍摄时,运用先进的红外摄影设备,在赞比亚跟踪了两只花豹,看到了这种独来独往的猫科动物,在黑夜里的秘密行踪。
      此字段为:内容摘要

334    ■a获奖情况
      假定存在获奖情况

606    ■a自然科学■x野生动物■y非洲
      主题:自然科学领域的野生动物 地点在非洲


       由于学校放假~~手边没有机读目录编写规则~~细节上可能有差错~~但基本方法就是这样

       另~~一些诸如价格、ISBN号、入藏地点等信息就不需要了~~除此之外~~以上是我工作中常用的字段~~基本反映了楼主提供的链接上的信息~~如有更多信息~~可再增加相关字段

       图书馆的馆藏能实现计算机检索~~就是以机读目录为支撑的~~机读目录可打印为馆藏信息卡片~~打印出来的信息就是我每组第二行写的~~就是“人”读的啦~~这种打印出来的卡片~~和早年咱们在图书馆翻的目录柜卡片盒里的卡片式一个性质~~当然现在需要把这个卡片盒电子化~~

       通过这个例子~~应该可以说明为啥“字段越丰富~~检索越方便”了
       至于分类号~~他的主要作用是把相近的资源放在一起~~能反映一些内容信息~~是检索途径之一~~也是字段之一~~但我单列出来以供对比

[ 本帖最后由 姐姐爱小小 于 2009-8-10 21:39 编辑 ]
作者: 姐姐爱小小    时间: 2009-8-10 22:48
灰常感谢楼主让我参与这次讨论~~~使我学到不少东西~~以下是我的一些思考

第一、如果我没有理解错的话~~wiki和中图分类法~~是两个很不相同的东西~~wiki是超文本系统~~和分类法无以比较孰

优孰劣~~

第二、在wiki上协作完善纪录片信息~~中图分类法归类~~是两种不同的分类思路
      前者是先有一个特定内容~~然后提取其特征~~在此基础上慢慢形成体系~~
      后者是先有分类体系~然后有一个特定内容~~在此基础上形成标识~~即:

      前者是“内容——标识——体系”的方式~~后者是“体系——内容——标识”的形式
      两种模式的各有优缺点~~~大家一看即知~~
      我想说的是~~可以在完善纪录片信息之后~~运用专业的分类法~~加以分类~~就是做一个类似当年图书馆书目卡片的电子数据~~供用户查询~~其实在内容上~~他们没用冲突~~~中图分类的依据~~就是大家完善后的信息~~只是做了归类和高度的浓缩~~~目的只有一个~~方便检索

第三、这几天我想了一下~~我想向楼主推荐的~~应该说是中图法做字段的这种思路~~而字段~上面说过~~主要是提供信息特征~~以供检索的~~~
至于分类的方法~~~不必全部按照中图法~~因为图书分类中~~我们也会用一些不完全遵守中图法的方法去分~~只要在一个馆中~~一直坚持一个标准即可~~如果标准混乱~~~最终必然丧失分类的意义~~这个可以想象得到~~

说到这~~应该可以捋清一个关系了~~“分类号”与“检索特征项”~~不是一个全等的关系~~“分类号”只是“检索特征项”之一~~

请问有多少人在图书馆借书~~或在CNKI检索论文时~~使用分类号~~很少吧~~这说明~~分类号的检索功能现在已经淡化~~相应的~~是上面所说的各种字段当中包含的检索信息~~~在广泛的使用~~这正是我极力推荐字段编写思路的原因

刚才说到~~分类中很重要的一点是“一直坚持一个标准”~~我想坚持运用现在使用的分类法也是可行的~~

第四、不需要过分强调分类体系~~我记得小家里有一个朋友说~~只要把检索功能做得更好就行了~~~我觉得他的说法抓住了网络检索行为的实质~~
即我们需要更多~~更细~~更个性的检索入口(提取这些检索特征项~叫“标引”)~~而分类号只是其中的一个入口而已~~

管理者需要做的~~~除了给出一个分类号之外~~~更重要的还是就资源标引出尽可能多的特征~~~这也正是目前很多图书馆也开始尝试标签分类法的原因~~

第五、一个疑问~~“机检”中~~~分类号真的那么重要吗
我自己就发现过很多从~~CNKI数据库中~~也会出现分类号错误的情况~~~但是我并没有这个文献的分类号错误而找不到他~~因为
1.我们很少用分类号去检索~~
2.检索后~~我们不需要到书架这样的实体上去找资源~~~而由电脑自动提取~~所以不会存在分类号错了~~这个资源就丧失了在实体库中的有序性的情况~~~

第六、分类号真的不重要吗
说了很多~~~是不是说分类号不重要~~当然不是~~~因为标签的有序性是发散型的~~但是线型也必不可少
比如~~在图书馆实体书架上~~分类号是图书排队(排架)的依据~~分类号错了~~植物学的书A可能就和动物学的排在一起~~一旦上架~~读者就不能在A应当在的队列中找到他~~~
另外~~当我们需要将相近资源集中在一起的时候~~~分类号是最好的排队依据~~只要给了号~~按号排列~~就一定可以实现这样的集中~~~

第七、重号问题
如果按现在的分类号~~~很多内容极其相近的资源是会重号的~~比如不同电视台拍的《故宫玉器收藏》~~~图书馆中是不允许出现重号情况的~~不知小家对此有没有要求~~
如果小家的资源可以重号的话~~那现在这样分也没问题~~如果不允许重号的话~~就需要考虑增加类似著者号这样的信息

分类体系是一个庞大而严密的问题~~我所知甚少甚少~~林奈创立生物分类学至今也不到300年~~300年间~~随着人类认识的每一次飞跃~~分类体系不断完善~~~所以~~以我的鼠目寸光~~是不敢妄言分类法本身的~~

但是有一点~~分类法的作用不只是给一个对象一个位置~~起码就医学上而言~~~同一上位类所属的下位类~~必然有很多相近的病理或生理属性(这正是分类的依据)~~因此~~可以借鉴彼此的研究方法~~

而在用户“机检”方面~~~特征标引的详细性~~~与分类的意义同样重要~~

一个字一个字敲的~~~如有不当请见谅~~再次感谢楼主~~

[ 本帖最后由 姐姐爱小小 于 2009-8-10 23:01 编辑 ]
作者: adyu    时间: 2009-8-11 08:12
己經看到姐姐愛小小的回覆, 內容很多, 容我仔細想想再回應
作者: adyu    时间: 2009-8-11 12:39
先回答幾個比較容易的, 會有一點跳躍, 但是一定會回答完畢.

分类号:這個我看只有懂的人才會編, 目前書館的工作人員好像只有2 位.
編完的呈現問題: 分类号要做成純文字or做成內部鏈結的清單, 都不會太難, 如果決心要做,是沒有問題的.

机读信息部分有些問題: 大部分wiki 己做成鏈結, 這裡是否需要重複?
再則, 如  215 ■a00:46:11■c624*480■d699M/305 ■ahttp://www.verycd.com/topics/91947/ 這些訊息是由資源發布者寫的, 有些資料可能是不太正確的.
三則, 如 101 2 ■a英语■c英语 / 330 ■a人类对..... 這些訊息可能會隨時更新

這部分是否現在有必要現在投入人力去做, 值得再討論

机读信息部分一大因難是如果做成如圖書館的圖書卡片那樣的資料, 就必需要有芋一種方法讓中圖法的机读信息部分與wiki 帖子本文的資料 保持一致, 不然等於沒有. 這個除非有懂程式的高手來開發一些工具, 不然光靠人力是沒法子做的.

其實机读信息部分就是要供user 查詢使用的. 這功能我在wiki 首頁用google 做了個客製化的查詢鏈結, 基本上可以滿足對wiki 的內容做全文檢索,足夠我們的需要. 只是小家WIKI 換用二級域名, GOOGLE 要重新建立小家WIKI 的內容 檢索,目前還查不到什麼, 但是再多等幾個月, 這功能一定會令人滿意的.
作者: 姐姐爱小小    时间: 2009-8-11 12:59
小家现在的分类法~~其实也没啥问题~~
好像大家希望改善的是检索的便捷性~~不知道我有没有理解错

我在想·~能不能做一个高级检索的界面~~
就像CNKI一样~~~可以同时在题名~~作者名~~关键词~~发表时间~等若干字段输入检索词~~
然后一次检出~~~

机读目录可以不编写~~而是借用机读目录的思路~~直接编写“人”读的
关键是标引要“精要”~~因为检索时我们都只是输入简单的词汇~~~
而且如果标引不简练~~~检不出的可能性就很大~~因为用户“猜”不中那个漫长的标引词
作者: 姐姐爱小小    时间: 2009-8-11 13:43
有一点我想我没说明白~~
wiki和标引~~不是谁取代谁的问题~~
标引的一切依据都来源于wiki~~~这就是为什么楼主觉得我做的字段的内容~~wiki都有的原因~~~

但是现在wiki没做标引~~就无法实现真正的高级检索~~eg
我输入“英国”这个词~~~~它是指出版国在英国~~还是在英国获过奖~~还是讲述关于英国的内容~~
我输入“英国 历史”~~是英国的历史片~~还是关于英国历史的片子~~
我输入“英国 中国 历史”~~~是英国拍的中国历史片~还是中国拍的英国历史片(空格链接的词~~在检索时逻辑关系是平行的)~~还是中英合拍的历史片~~还是内容为“历史上的中英关系”的片子~~~还是在英国获奖的中国历史片~~
.........

这说明~~~输入多个词的时候~~~如果不标引清楚这些词所在的字段~~~检索的目标是含混的~~~
所以真正的高级检索~~~必然需要字段标引为支撑
而一旦有了标引和高级检索~~那一串中国~英国~历史~~的绕口令~~
只需要输入三个词~~选择一下字段就限定清楚了

这就有对比了~~
wiki是人脑识别的东西~~当然也有初级的检索功能~~
标引~~是人机对话的媒介~~~管理者通过标引给每一个片子贴上若干标签~~用户输入检索词之后~~系统自动将标引词与检索词进行对比~~~匹配即为命中的结果~~

高级检索的功能现在看起来不是很必须~~
但是如果要长期发展~~~这个前提我第一次回帖就说明了~~~必须考虑向高级检索过渡~~
因为数量一旦达到某一临界点~~~初级检索的结果~~~就会很庞大~~~相关性也会很不理想(即查准率太低)~~需要用户花大量时间去目筛~~~比如搜索引擎
而高级检索~~则可以大大提高相关性~~~这就是为什么CNKI~~VIP~~这样的专业数据库都要做标引~~都要做高级检索的原因~~~

现在~~标引的好坏~~~直接影响着一个数据库的受欢迎程度~~eg~~
这里一定有医学专业的朋友~~
医学专业的朋友~~如果对CNKI和CBM都很熟悉~~~就会知道CBM的查全率和查准率~~都是CNKI无法企及的~~为什么~~
就是因为CBM在标引中使用了“医学主题词表”~~
早年CBM是不能下载全文的~~就是说~~只能查查~~期刊上发表过的文章有哪些~~~看看文摘~~~但是他同样卖钱~~
卖点就在“标引”~~
这个例子应该可以说明~~~数量庞大之后~~标引对“检索”有多重要了~~

所以~~~小家的资源如果有十年~~二十年~~三十年~~不断丰富的可能~~~或早或晚是需要做“标引”类似性质的工作的~~

要不检索会非常不便

当然~~~标引原来积累的诸多资源~~
工作量很大~~~但是只要就相应的检索对应关系做好编程~~~
大家都可以做这样的工作~~

我的机读目录在小家是不可用的~~~因为需要相应的软件来读~~~要不也就不叫机读目录了
我只是推荐方法·~

如有人可以把标引词·~检索词~~字段之间~~做好衔接~~然后把衔接的规则告诉大家~~~那任何一个都可以做标引~~

[ 本帖最后由 姐姐爱小小 于 2009-8-11 13:54 编辑 ]
作者: adyu    时间: 2009-8-11 14:42
>>我在想·~能不能做一个高级检索的界面~~
就像CNKI一样~~~可以同时在题名~~作者名~~关键词~~发表时间~等若干字段输入检索词~~


2 篇回覆應該都是這個問題
小家WIKI  是利用 MEDIAWIKI建立起來的. 在它的官網上 有100多個extensions(別人寫好的一些小程式, 可以提供一些特定的功能)
目前我看到有一個extensions 應該是可以做到你說的要求.
無奈, 參見  4樓
1.空間商問題, WIKI 環境被限制用比較舊的程式版本, 以致有一些extensions不能使用
2.我跟紅海對WIKI的這些深入的功能都不熟,希望以後能有一些程式OR系統高手來參與,
引進這些額外的功能,使wiki 的功能更加豐富
作者: adyu    时间: 2009-8-12 08:19
另外說一下幻想中的世界

隨著帖子逐漸增多, 內容性質分類逐漸完善(是指分類安排能儘量符合大家的習慣, 沒有特別怪異的分類)
就可以把小家wiki 向大家推銷, 組織一些小家的次級團體比方說喜歡軍事, 音樂....的.
那就可以把部分的帖子交給他們托管, 讓他們去繼續豐富帖子的內容, 修訂帖子的分類 or 再細分分類目錄.....
這些都是未來可能的發展方向.那時才是真正實現"協作"的時候,
不像現在, 大概都是我跟阿聚在做這件事

我也預留了細分分類目錄的空間. 有些分類目錄,再細分現在的分類目錄,實際效用不大, 反而會累死人. 比方說: 可能有人對獅子,航空母艦 情有獨鐘. 他可以再建立一個自行定義的"獅子","航空母艦"的目錄, 這樣他就不用再到"食肉目,"海戰武器"裡去找了.
作者: adyu    时间: 2009-8-12 11:22
關於姐姐小小所說的 檢索, 標籤的事, 可以經由15,16 樓的說明來實現

自定義分類項目, 也可以定出一個 伊莉莎白女王時代的英國, 希臘化時代的埃及, 巴洛克時代的繪畫音樂.... 這類的複合式的分類項目




欢迎光临 纪录片之家.十八岁 (http://jlpzj.net/) Powered by Discuz! X3.2