纪录片之家.十七岁

 找回密码
 注册
查看: 5974|回复: 16
打印 上一主题 下一主题

[讨论] ABOUT《中国图书馆分类法》

 关闭 [复制链接] x 0
跳转到指定楼层
1
发表于 2009-8-8 10:08:29 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
就我的認知, 所有的圖書館分類法都是類似的做法,分類...決定出一本書(VIDEO)的唯一編號. 出一本書(VIDEO)的名字只會出現一次, 所以大家必需先去了解圖書館分類法,才能順藤摸瓜, 找到書(VIDEO).
但是小家wiki的分類不同, 書(VIDEO)的名字會出現在每一層的分類目錄裡.

拿 食肉目 做例子說明,
在中国图书馆分类法裡 分類是Q959.838, 影片名只會出現在”食肉目”的分類下,在”哺乳類”,”動物”等分類下是不會有 影片名的.
而在小家wiki的分類裡,影片名會出現在”食肉目”,”哺乳類”,”動物”等分類下

----以上如有錯, 請更正--------

HI 我想可以這麼做

1. 姐姐爱小小 先挑2,30 個片名試做分類,結果用HTML的表格呈現(要有分類編號,影片名).到時候我再放到WIKI上
2. 我再補充幾個片名, 請姐姐爱小小 再編(主要是增加測試的涵蓋範圍)
3. 討論呈現的方法, 簡單版就是,請姐姐爱小小在 ”影片原始規格:”下再多加一行中国图书馆分类法的分類編號.
回复

使用道具 举报

17
 楼主| 发表于 2009-8-12 11:22:34 | 只看该作者
關於姐姐小小所說的 檢索, 標籤的事, 可以經由15,16 樓的說明來實現

自定義分類項目, 也可以定出一個 伊莉莎白女王時代的英國, 希臘化時代的埃及, 巴洛克時代的繪畫音樂.... 這類的複合式的分類項目
回复 支持 反对

使用道具 举报

16
 楼主| 发表于 2009-8-12 08:19:24 | 只看该作者
另外說一下幻想中的世界

隨著帖子逐漸增多, 內容性質分類逐漸完善(是指分類安排能儘量符合大家的習慣, 沒有特別怪異的分類)
就可以把小家wiki 向大家推銷, 組織一些小家的次級團體比方說喜歡軍事, 音樂....的.
那就可以把部分的帖子交給他們托管, 讓他們去繼續豐富帖子的內容, 修訂帖子的分類 or 再細分分類目錄.....
這些都是未來可能的發展方向.那時才是真正實現"協作"的時候,
不像現在, 大概都是我跟阿聚在做這件事

我也預留了細分分類目錄的空間. 有些分類目錄,再細分現在的分類目錄,實際效用不大, 反而會累死人. 比方說: 可能有人對獅子,航空母艦 情有獨鐘. 他可以再建立一個自行定義的"獅子","航空母艦"的目錄, 這樣他就不用再到"食肉目,"海戰武器"裡去找了.
回复 支持 反对

使用道具 举报

15
 楼主| 发表于 2009-8-11 14:42:46 | 只看该作者
>>我在想·~能不能做一个高级检索的界面~~
就像CNKI一样~~~可以同时在题名~~作者名~~关键词~~发表时间~等若干字段输入检索词~~


2 篇回覆應該都是這個問題
小家WIKI  是利用 MEDIAWIKI建立起來的. 在它的官網上 有100多個extensions(別人寫好的一些小程式, 可以提供一些特定的功能)
目前我看到有一個extensions 應該是可以做到你說的要求.
無奈, 參見  4樓
1.空間商問題, WIKI 環境被限制用比較舊的程式版本, 以致有一些extensions不能使用
2.我跟紅海對WIKI的這些深入的功能都不熟,希望以後能有一些程式OR系統高手來參與,
引進這些額外的功能,使wiki 的功能更加豐富
回复 支持 反对

使用道具 举报

14
发表于 2009-8-11 13:43:08 | 只看该作者
有一点我想我没说明白~~
wiki和标引~~不是谁取代谁的问题~~
标引的一切依据都来源于wiki~~~这就是为什么楼主觉得我做的字段的内容~~wiki都有的原因~~~

但是现在wiki没做标引~~就无法实现真正的高级检索~~eg
我输入“英国”这个词~~~~它是指出版国在英国~~还是在英国获过奖~~还是讲述关于英国的内容~~
我输入“英国 历史”~~是英国的历史片~~还是关于英国历史的片子~~
我输入“英国 中国 历史”~~~是英国拍的中国历史片~还是中国拍的英国历史片(空格链接的词~~在检索时逻辑关系是平行的)~~还是中英合拍的历史片~~还是内容为“历史上的中英关系”的片子~~~还是在英国获奖的中国历史片~~
.........

这说明~~~输入多个词的时候~~~如果不标引清楚这些词所在的字段~~~检索的目标是含混的~~~
所以真正的高级检索~~~必然需要字段标引为支撑
而一旦有了标引和高级检索~~那一串中国~英国~历史~~的绕口令~~
只需要输入三个词~~选择一下字段就限定清楚了

这就有对比了~~
wiki是人脑识别的东西~~当然也有初级的检索功能~~
标引~~是人机对话的媒介~~~管理者通过标引给每一个片子贴上若干标签~~用户输入检索词之后~~系统自动将标引词与检索词进行对比~~~匹配即为命中的结果~~

高级检索的功能现在看起来不是很必须~~
但是如果要长期发展~~~这个前提我第一次回帖就说明了~~~必须考虑向高级检索过渡~~
因为数量一旦达到某一临界点~~~初级检索的结果~~~就会很庞大~~~相关性也会很不理想(即查准率太低)~~需要用户花大量时间去目筛~~~比如搜索引擎
而高级检索~~则可以大大提高相关性~~~这就是为什么CNKI~~VIP~~这样的专业数据库都要做标引~~都要做高级检索的原因~~~

现在~~标引的好坏~~~直接影响着一个数据库的受欢迎程度~~eg~~
这里一定有医学专业的朋友~~
医学专业的朋友~~如果对CNKI和CBM都很熟悉~~~就会知道CBM的查全率和查准率~~都是CNKI无法企及的~~为什么~~
就是因为CBM在标引中使用了“医学主题词表”~~
早年CBM是不能下载全文的~~就是说~~只能查查~~期刊上发表过的文章有哪些~~~看看文摘~~~但是他同样卖钱~~
卖点就在“标引”~~
这个例子应该可以说明~~~数量庞大之后~~标引对“检索”有多重要了~~

所以~~~小家的资源如果有十年~~二十年~~三十年~~不断丰富的可能~~~或早或晚是需要做“标引”类似性质的工作的~~

要不检索会非常不便

当然~~~标引原来积累的诸多资源~~
工作量很大~~~但是只要就相应的检索对应关系做好编程~~~
大家都可以做这样的工作~~

我的机读目录在小家是不可用的~~~因为需要相应的软件来读~~~要不也就不叫机读目录了
我只是推荐方法·~

如有人可以把标引词·~检索词~~字段之间~~做好衔接~~然后把衔接的规则告诉大家~~~那任何一个都可以做标引~~

[ 本帖最后由 姐姐爱小小 于 2009-8-11 13:54 编辑 ]
回复 支持 反对

使用道具 举报

13
发表于 2009-8-11 12:59:11 | 只看该作者
小家现在的分类法~~其实也没啥问题~~
好像大家希望改善的是检索的便捷性~~不知道我有没有理解错

我在想·~能不能做一个高级检索的界面~~
就像CNKI一样~~~可以同时在题名~~作者名~~关键词~~发表时间~等若干字段输入检索词~~
然后一次检出~~~

机读目录可以不编写~~而是借用机读目录的思路~~直接编写“人”读的
关键是标引要“精要”~~因为检索时我们都只是输入简单的词汇~~~
而且如果标引不简练~~~检不出的可能性就很大~~因为用户“猜”不中那个漫长的标引词
回复 支持 反对

使用道具 举报

12
 楼主| 发表于 2009-8-11 12:39:31 | 只看该作者
先回答幾個比較容易的, 會有一點跳躍, 但是一定會回答完畢.

分类号:這個我看只有懂的人才會編, 目前書館的工作人員好像只有2 位.
編完的呈現問題: 分类号要做成純文字or做成內部鏈結的清單, 都不會太難, 如果決心要做,是沒有問題的.

机读信息部分有些問題: 大部分wiki 己做成鏈結, 這裡是否需要重複?
再則, 如  215 ■a00:46:11■c624*480■d699M/305 ■ahttp://www.verycd.com/topics/91947/ 這些訊息是由資源發布者寫的, 有些資料可能是不太正確的.
三則, 如 101 2 ■a英语■c英语 / 330 ■a人类对..... 這些訊息可能會隨時更新

這部分是否現在有必要現在投入人力去做, 值得再討論

机读信息部分一大因難是如果做成如圖書館的圖書卡片那樣的資料, 就必需要有芋一種方法讓中圖法的机读信息部分與wiki 帖子本文的資料 保持一致, 不然等於沒有. 這個除非有懂程式的高手來開發一些工具, 不然光靠人力是沒法子做的.

其實机读信息部分就是要供user 查詢使用的. 這功能我在wiki 首頁用google 做了個客製化的查詢鏈結, 基本上可以滿足對wiki 的內容做全文檢索,足夠我們的需要. 只是小家WIKI 換用二級域名, GOOGLE 要重新建立小家WIKI 的內容 檢索,目前還查不到什麼, 但是再多等幾個月, 這功能一定會令人滿意的.
回复 支持 反对

使用道具 举报

11
 楼主| 发表于 2009-8-11 08:12:47 | 只看该作者
己經看到姐姐愛小小的回覆, 內容很多, 容我仔細想想再回應
回复 支持 反对

使用道具 举报

10
发表于 2009-8-10 22:48:08 | 只看该作者
灰常感谢楼主让我参与这次讨论~~~使我学到不少东西~~以下是我的一些思考

第一、如果我没有理解错的话~~wiki和中图分类法~~是两个很不相同的东西~~wiki是超文本系统~~和分类法无以比较孰

优孰劣~~

第二、在wiki上协作完善纪录片信息~~中图分类法归类~~是两种不同的分类思路
      前者是先有一个特定内容~~然后提取其特征~~在此基础上慢慢形成体系~~
      后者是先有分类体系~然后有一个特定内容~~在此基础上形成标识~~即:

      前者是“内容——标识——体系”的方式~~后者是“体系——内容——标识”的形式
      两种模式的各有优缺点~~~大家一看即知~~
      我想说的是~~可以在完善纪录片信息之后~~运用专业的分类法~~加以分类~~就是做一个类似当年图书馆书目卡片的电子数据~~供用户查询~~其实在内容上~~他们没用冲突~~~中图分类的依据~~就是大家完善后的信息~~只是做了归类和高度的浓缩~~~目的只有一个~~方便检索

第三、这几天我想了一下~~我想向楼主推荐的~~应该说是中图法做字段的这种思路~~而字段~上面说过~~主要是提供信息特征~~以供检索的~~~
至于分类的方法~~~不必全部按照中图法~~因为图书分类中~~我们也会用一些不完全遵守中图法的方法去分~~只要在一个馆中~~一直坚持一个标准即可~~如果标准混乱~~~最终必然丧失分类的意义~~这个可以想象得到~~

说到这~~应该可以捋清一个关系了~~“分类号”与“检索特征项”~~不是一个全等的关系~~“分类号”只是“检索特征项”之一~~

请问有多少人在图书馆借书~~或在CNKI检索论文时~~使用分类号~~很少吧~~这说明~~分类号的检索功能现在已经淡化~~相应的~~是上面所说的各种字段当中包含的检索信息~~~在广泛的使用~~这正是我极力推荐字段编写思路的原因

刚才说到~~分类中很重要的一点是“一直坚持一个标准”~~我想坚持运用现在使用的分类法也是可行的~~

第四、不需要过分强调分类体系~~我记得小家里有一个朋友说~~只要把检索功能做得更好就行了~~~我觉得他的说法抓住了网络检索行为的实质~~
即我们需要更多~~更细~~更个性的检索入口(提取这些检索特征项~叫“标引”)~~而分类号只是其中的一个入口而已~~

管理者需要做的~~~除了给出一个分类号之外~~~更重要的还是就资源标引出尽可能多的特征~~~这也正是目前很多图书馆也开始尝试标签分类法的原因~~

第五、一个疑问~~“机检”中~~~分类号真的那么重要吗
我自己就发现过很多从~~CNKI数据库中~~也会出现分类号错误的情况~~~但是我并没有这个文献的分类号错误而找不到他~~因为
1.我们很少用分类号去检索~~
2.检索后~~我们不需要到书架这样的实体上去找资源~~~而由电脑自动提取~~所以不会存在分类号错了~~这个资源就丧失了在实体库中的有序性的情况~~~

第六、分类号真的不重要吗
说了很多~~~是不是说分类号不重要~~当然不是~~~因为标签的有序性是发散型的~~但是线型也必不可少
比如~~在图书馆实体书架上~~分类号是图书排队(排架)的依据~~分类号错了~~植物学的书A可能就和动物学的排在一起~~一旦上架~~读者就不能在A应当在的队列中找到他~~~
另外~~当我们需要将相近资源集中在一起的时候~~~分类号是最好的排队依据~~只要给了号~~按号排列~~就一定可以实现这样的集中~~~

第七、重号问题
如果按现在的分类号~~~很多内容极其相近的资源是会重号的~~比如不同电视台拍的《故宫玉器收藏》~~~图书馆中是不允许出现重号情况的~~不知小家对此有没有要求~~
如果小家的资源可以重号的话~~那现在这样分也没问题~~如果不允许重号的话~~就需要考虑增加类似著者号这样的信息

分类体系是一个庞大而严密的问题~~我所知甚少甚少~~林奈创立生物分类学至今也不到300年~~300年间~~随着人类认识的每一次飞跃~~分类体系不断完善~~~所以~~以我的鼠目寸光~~是不敢妄言分类法本身的~~

但是有一点~~分类法的作用不只是给一个对象一个位置~~起码就医学上而言~~~同一上位类所属的下位类~~必然有很多相近的病理或生理属性(这正是分类的依据)~~因此~~可以借鉴彼此的研究方法~~

而在用户“机检”方面~~~特征标引的详细性~~~与分类的意义同样重要~~

一个字一个字敲的~~~如有不当请见谅~~再次感谢楼主~~

[ 本帖最后由 姐姐爱小小 于 2009-8-10 23:01 编辑 ]
回复 支持 反对

使用道具 举报

9
发表于 2009-8-10 21:16:36 | 只看该作者
分类号:
    Q959.838     哺乳动物食肉目 (含有Q959.8,就表示他已经在哺乳类之下了)
    Q958.15+5   动物群落分布  

以下是根据楼主提供的链接信息做的机读信息和相应的含义

100    ■a1997
          1997年出版发行
      (此字段内容根据书籍与纪录片发行方式的不同,做过简化)

101 2  ■a英语■c英语
      原语种英语,现在还是英语,但附有字幕

102    ■a英国
      出版国英国

200 1  ■aLeopard ■f导演姓名■h4
           题名Leopard,导演为XXX,系列中的第四集

210    ■a英国■cBBC
           出版地点英国(或某城市),出版者BBC

215    ■a00:46:11■c624*480■d699M
           时长00:46:11,分辨率624*480,大小699M
         (此字段内容根据书籍与纪录片载体形式的不同,做过更改)

225 2  ■awildlife specials■fBBC
           本片属于BBC的wildlife specials系列

305    ■ahttp://www.verycd.com/topics/91947/
          下载地址http://www.verycd.com/topics/91947/
         (此字段根据书籍与纪录片来源方式的不同,做过更改)
      
306    ■aBBC 中央电视台
      假定存在联合出版现象

330    ■a人类对非洲猫科动物中花豹知之甚少。直到现在,花豹,这种夜行动物几乎不可能被人类所了解。本片在拍摄时,运用先进的红外摄影设备,在赞比亚跟踪了两只花豹,看到了这种独来独往的猫科动物,在黑夜里的秘密行踪。
      此字段为:内容摘要

334    ■a获奖情况
      假定存在获奖情况

606    ■a自然科学■x野生动物■y非洲
      主题:自然科学领域的野生动物 地点在非洲


       由于学校放假~~手边没有机读目录编写规则~~细节上可能有差错~~但基本方法就是这样

       另~~一些诸如价格、ISBN号、入藏地点等信息就不需要了~~除此之外~~以上是我工作中常用的字段~~基本反映了楼主提供的链接上的信息~~如有更多信息~~可再增加相关字段

       图书馆的馆藏能实现计算机检索~~就是以机读目录为支撑的~~机读目录可打印为馆藏信息卡片~~打印出来的信息就是我每组第二行写的~~就是“人”读的啦~~这种打印出来的卡片~~和早年咱们在图书馆翻的目录柜卡片盒里的卡片式一个性质~~当然现在需要把这个卡片盒电子化~~

       通过这个例子~~应该可以说明为啥“字段越丰富~~检索越方便”了
       至于分类号~~他的主要作用是把相近的资源放在一起~~能反映一些内容信息~~是检索途径之一~~也是字段之一~~但我单列出来以供对比

[ 本帖最后由 姐姐爱小小 于 2009-8-10 21:39 编辑 ]
回复 支持 反对

使用道具 举报

8
 楼主| 发表于 2009-8-9 08:30:14 | 只看该作者
事情都還沒講清楚, 別先爭吵, 都是我表達不清, 好像事情都亂了套了.
=====================================================================================
重新來說一次.
1. 因為我跟阿聚對《中国图书馆分类法》 不熟, swing116,姐姐爱小小2 位又對wiki 的分類不熟, 第一步就是要先用小家wiki 現有的影片依《中国图书馆分类法》分類, 做個測試, 看實際有那些問題.

2. 麻煩 姐姐爱小小以 Leopard《花豹》為例編成中国图书馆分类法的目錄.
表現形式, 你方便就好, 另外, 再請編一下這個"大多数书都有20个以上的字段"
我覺得 或許姐姐爱小小所說的"大多数书都有20个以上的字段" 跟wiki 的分類目錄是很類似的東西.

然後我們再討論
回复 支持 反对

使用道具 举报

7
发表于 2009-8-9 00:36:39 | 只看该作者
给个比较完整的中图法类目详表
http://202.196.16.22/clc/index.asp       树式列表式
http://www.lib.sjtu.edu.cn/view.do?id=516       超链接页面式
wikipedia也有列表,但没有这两个详细.我对比过了
回复 支持 反对

使用道具 举报

6
发表于 2009-8-9 00:21:10 | 只看该作者
原帖由 姐姐爱小小 于 2009-8-8 20:48 发表
另,你所举的例子·~
在分类里~~这样的情况很普遍·~
对于现在很常见的交叉学科~~~分类法通过“参见”赋予一 ...


我补充一下
关于“参见”,指的大概就是“互见”吧?
就是指一本书有多个分类号。一般一本书只有一个索书号,找书就找一个地方就行了,但有的书是交叉学科,例如《计算机英语读物》,可以归到 英文读物H319.4,也可以归到 计算机TP3,为了两个领域的读者都能查找到,可以采用“互见”的方式,也就是在H和TP这两个地方都放有这本书,而计算机机读目录里也容许一条图书记录有两个分类号。
不过要用互见的情况一般也只有两重互见,最多的我就见过三重。当然,那将是一本书书脊贴的号和它归属的书架,不可能给太多,所以分的时候还是得慎重,不可能像给标签、给关键字那样随性和多样。不过话说回来,如果是用关键字或题名之类查书的话(而不是用分类号查),无论放在一个大类还是两个大类,照样能找到这本书,况且一本书也很少跨那么多学科的。

关于WIKI的呈现方式(一楼),楼主的意思大概是,如果《计算机英语读物》给它分到H319.4,那么除了在H319.4以外,在H319、H31、H3、H下也能直接见片名吧?
如果这样,那么分类时的一个难题,分类细致到的层次,就不用又考虑细致度又考虑查询率地左右为难了。一分就分到最细就OK了。
找片者需求明确的,可以直接找分类法最细的级别,出来的片子列表很短,可以很快找到需要的;需求不明确只有个大概方向的,可以找大一层的类,琳琅满目花多眼乱一下,也不会漏掉哪一部。
上述的互见,WIKI系统应该也可以做到吧(一部片在此分类列表里出现多次,只是链接的指向和标识问题,应该没有唯一性要求吧)?应该问题不大。

关于著录,我想我们在小家down到的片子,信息都是有限,不能像拿在手的正版图书有CIP有ISBN有版权页甚至有赠送的marc那样信息完整。不过一般发片时简介都有些可用信息吧,例如类型、片名、语言、字幕语种、年份、厂牌、持续时间、内容简介、码率等等,可以用,虽然各类片源这些信息很不齐整,但片名和链接总是有的吧,那么就这俩作必备字段,其他都作可选咯。建议小家给大家发片时定个格式,有效格式才能加分。。呵呵。
……猛然发觉,楼主的意思是不是不另外做片目,而是直接把片名塞到WIKI分类法某类目的页面下,然后片名链接就直接用在小家发片帖子的链接。。?那么关于厂牌、码率、视频格式、语言、字幕语种这几个明确、可做索引的信息,可否由用户发帖的时候填写相应的表单自动实现(如果分类由专业人员来做的话)?抱歉,我真的对WIKI跟论坛的结合程度没什么了解过
回复 支持 反对

使用道具 举报

5
发表于 2009-8-8 22:01:24 | 只看该作者
原帖由 姐姐爱小小 于 2009-8-8 21:19 发表
难道你认为图书馆的人是看过书之后再做编目的吗?

图书馆的编目体系之所以好用~~除了分类体系之外~~
还在于它可以就文献的内容、外部形态等若干特征~~~编制出若干字段~~
字段越多·~反映图书的信息越详细·~~用 ...


我只是在阐述我编辑片子时遇到的实际问题,
请不要推测我的意思。
版主说得对,
找部片子按照你自己的想法编编看,
将你的想法化成实际的文字展示出来,
这是最好的方法。

[ 本帖最后由 nideyingzi 于 2009-8-8 22:14 编辑 ]
回复 支持 反对

使用道具 举报

4
发表于 2009-8-8 21:19:53 | 只看该作者

回复 3楼 的帖子

难道你认为图书馆的人是看过书之后再做编目的吗?

图书馆的编目体系之所以好用~~除了分类体系之外~~
还在于它可以就文献的内容、外部形态等若干特征~~~编制出若干字段~~
字段越多·~反映图书的信息越详细·~~用户查询越方便~~

如果一本书只有题名和作者字段~~~找到他就只有两种方法·~查询是很不方便的
但是现在的图书编目·~~大多数书都有20个以上的字段~~~
这就是查询方便的原因

[ 本帖最后由 姐姐爱小小 于 2009-8-8 21:23 编辑 ]
回复 支持 反对

使用道具 举报

3
发表于 2009-8-8 21:09:11 | 只看该作者
这个 图书馆分类 很专业很科学,非常细致,

但要考虑到WIKI的现实情况,
在WIKI编辑片子的时候,不可能每部片子都是看过才编辑的,
更多的是依靠影片本身的内容简介来归纳条目,
有的内容介绍翔实,有的只是一笔带过,
所以编的时候只是尽可能的准确,
很多片子并不清楚有无遗漏的条目未归纳,
所以能把条目修的更完善固然是好事,

更多的校准 工作,
需要大家一起的努力,去投入精力热情去修改,补充。。。。
回复 支持 反对

使用道具 举报

2
发表于 2009-8-8 20:48:25 | 只看该作者
“ 先挑2,30 ”是啥意思?
HTML的表格呈現我不会做啊~~~
让我做哪些?你给我个链接好吗?

另,你所举的例子·~
在分类里~~这样的情况很普遍·~
对于现在很常见的交叉学科~~~分类法通过“参见”赋予一本书两个分类号~~
在图书馆检索系统下·~~任何一个分类号都可以查到这本书~~
也就是说·~~不是一本书只有一个分类号·~~

各个馆根据读者情况和馆藏情况·~决定哪个做第一分类号~~
如:《高血压防治常见问题》这样的书~~在综合性图书馆可能先分编到内科学下·~
但是在专业医学馆~~~很有可能先分编到保健之下

[ 本帖最后由 姐姐爱小小 于 2009-8-8 20:59 编辑 ]
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|纪录片之家

GMT+8, 2024-12-26 09:54 , Processed in 0.115070 second(s), 39 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表