تبلیغات
مدیریت دانش - مطالب محمد حسین هراتیان

مدیریت دانش
با توجه ویژه به پیشرفت این رشته در ایران و معادل یابی فارسی برای واژگان

به وبلاگ  مدیریت دانش  خوش آمدید. چنانچه علاقه مند به همكاری هستید با ما تماس بگیرید.


¿نگاشت دانش
شنبه 27 خرداد 1385

بنا بر گفته ی Jan Lanzing (1997)  از دانشگاه Twente، نگاشت مفاهیم تکنیکی است برای بازنمایی دانش در گراف ها. گراف های دانش، شبکه هایی از مفاهیم هستند. این شبکه ها متشکل از گره ها و یال ها می باشند. گره ها نماینده ی مفاهیم و یال ها نماینده ی روابط میان مفاهیم هستند. Lanzing اضافه می کند که مفاهیم و گاهاً یال ها می توانند برچسب دار باشند. یال ها ممکن است بدون جهت، یک جهته و یا دو جهته باشند.

نگاشت مفاهیم به چندین منظور انجام می شود (Lanzing, 1997):

·        برای خلق ایده (طوفان ذهنی[1])

·        برای طراحی یک ساختار پیچیده (long text ها، ابر رسانه[2]، وب سایت های بزرگ و ...)

·        برای برقراری ارتباط با ایده های پیچیده

·        کمک به یادگیری از طریق یکپارچه سازی صریح دانش های کهنه و جدید

·        برای تعیین فهم و یا تشخیص عدم فهم

ایده ی نقشه های دانش و نگاشت دانش در فیلد مدیریت دانش، مشابه استفاده از نقشه های مفاهیم و نگاشت مفهومی[3] است. نگاشت دانش تکنیک پویایی است برای تبدیل دانش contextual به دانشی قابل بازنمایی، صریح و قابل انتقال به دیگران. در حوزه ی مدیریت دانش، نگاشت دانش مربوط است به نگاشت مفهومی به روشی کاملاً مستقیم. به طور خاص، هدف نگاشت دانش عبارت است از توسعه ی یک ساختار شبکه ای که مفاهیم و روابط مربوط به آنها را به منظور شناسایی دانش موجود در سازمان (و یا یک حوزه ی کاملاً تعریف شده) بازنمایی کرده و تعیین می کند که در چه محل هایی از پایگاه دانش سازمان شکاف وجود دارد.



[1] - Brainstorming

[2] - Hypermedia

[3] - Conceptual mapping

نوشته شده در شنبه 27 خرداد 1385 و ساعت 05:06 ق.ظ توسط : محمد حسین هراتیان
ویرایش شده در - و ساعت -


¿Equity
یکشنبه 31 اردیبهشت 1385

سلام به همه!

معادل مناسب برای

Equity لصفاً پیشنهاد بدین.

Knowledge taxonomy

 

When developing a knowledge management system, a vocabulary of terms and relationships is often the by-product of the knowledge map. In essence, a key result of the knowledge mapping exercise is to generate a hierarchical grouping of terms that will serve as the standard vocabulary for structuring the knowledge management system for the organization

            For example, the Naval Surface Warfare Center-Carderock Division (NSWCCD), part of the U.S. Navy that does research and development in submarine and ship design, has recently undertaken a knowledge management effort in which one of the first steps was to develope e knowledge taxonomy. The knowledge taxonomy was developed by first determining the core strategic equities for the Naval Surface Warfare Center as a whole. There were seven core equities established. Based on those core equities, strategic planning key areas were identified for the Carderock Division, and then sixty key technical areas were mapped to those strategic planning key areas and core equities.

نوشته شده در یکشنبه 31 اردیبهشت 1385 و ساعت 03:05 ق.ظ توسط : محمد حسین هراتیان
ویرایش شده در - و ساعت -


¿knowledge map
جمعه 15 اردیبهشت 1385

سلام دوستان!

ممکنه به من کمک کنین تا تعریف نقشه ی دانش را با هم ترجمه کنیم؟ این تعریف توی همون کتابی که قبلا گفتم دارم ترجمه می کنم اومده:

According to Wright(1993), a knowledge map is an interactive, open system for dialogue
that defines, organizes, and builds on the intuitive, structured, and procedural knowledge used to explore and solve problems.

پیشاپیش ممنون

نوشته شده در جمعه 15 اردیبهشت 1385 و ساعت 02:05 ق.ظ توسط : محمد حسین هراتیان
ویرایش شده در - و ساعت -


¿ازکتابِ Knowledge Management: learning from knowledge engineering
شنبه 9 اردیبهشت 1385
مردی وارد یکی از بانک های شهر نیویورک سیتی شد و برای سفر دو هفته ای اش به اروپا، تقاضای 2000 دلار وام کرد. کارمند بانک از مرد پرسید که چه وثیقه ای در اختیار بانک می گذارد؟ مرد به رویلز رویسش که جلوی بانک پارک شده بود اشاره کرد و کلید آن را به کارمند بانک سپرد. آنگاه بعد از دو هفته که از اروپا بازگشت برای بازپرداخت وام به بانک مراجعه کرد. مرد از کارمند پرسید که چقدر باید بپردازد کارمند پاسخ داد: "2000 دلار برای اصل وام به علاوه ی 15.46 دلار برای بهره ی وام" وسپس ادامه داد: "من سابقه ی شما را بررسی کردم و متوجه شدم که شما یکی از مالتی میلیونر های شهر نیویورک هستید، چطور است که برای چنین مبلغ اندکی از بانک تفاضای وام کردید؟" مرد پاسخ داد: "چه جای دیگری در نیویورک می توانستم ماشینم را برای مدت دو هفته و تنها در ازای مبلغ 15.46 دلار پارک کنم؟" من این روزها مشغول ترجمه ی بخش هایی ازکتابِ Knowledge Management: learning from knowledge engineering از آقای Jay Liebowitz هستم. حکایت بالا هم از فصل اول این کتابه. چند تا سوال هم دارم که اگه دوستان کمک کنن بسیار ممنون می شم: O Leverage کردن دانش یعنی چه؟ مثلا توی این جمله:… Organizations worldwide have realized that their future growth is predicated on how well they create, manage, share, and leverage their knowledge internally and externally. O فرق بین asset و capital چیه؟ Knowledge management is the process of creating value from an organization’s intangible assets. Intangible assets, also referred to as intellectual capital, include human capital, structural capital, and customer or relationship capital. از خانم ها بیگ و قوامی فر هم می خوام که اگه ممکنه mail شون رو در اختیار من بذارن. haratian@iaun.ac.ir

نوشته شده در شنبه 9 اردیبهشت 1385 و ساعت 08:04 ق.ظ توسط : محمد حسین هراتیان
ویرایش شده در - و ساعت -


¿سیستم های خبره - ۲
چهارشنبه 12 بهمن 1384

در یک سیستم خبره٬ قوانین کد شده به عنوان مهارت٬ در یک پایگاه دانش نگه داشته می شوند. مکانیزمی که از میان قوانینی که در یک مساله می توان از آنها استفاده کرد٬ قوانین مناسب را انتخاب می کند٬ «موتور استنتاج» خوانده می شود. موتور استنتاج٬ «مقدم» های قوانین را بررسی می کند و بر مبنای آنها عملیات ذکر شده در «تالی» قوانین را اجرا می کند. برای نگه داشتن مساله در حالت حل شده٬ موتور استنتاج از یک ساختار خاص برای ذخیره ی حالت راه حل مساله استفاده می کند. این ساختار خاص «حافظه کوتاه مدت» خوانده می شود. در شکل زیر شمایی از یک سیستم خبره مبتنی بر قانون نشان داده شده است:

قوانین مناسب٬ برای حالت جاری مساله در حافظه کوتاه مدت٬ انتخاب شده و به کار گرفته می شوند. زمانی که موتور استنتاج قانونی را شناسایی می کند٬ عملیات خاصی انجام می شود که خود می تواند منجر به تغییر حالت مساله در حافظه کوتاه مدت شود. تا زمانی که مساله حل شود و یا هیچ شرطی بر آورده نشود و یا سیستم خبره صریحا متوقف شود٬ این فرایند تکرار خواهد شد.

شکل فوق٬ سیستم خبره ای را نشان می دهد که در پایه ای ترین سطح خود قرار دارد: سیستمی که قوانینی را انتخاب کرده و برای حل مساله از آنها استفاده می کند. سیستم های خبره٬ علاوه بر مکانیزم پایه ای ذکر شده٬ از استراتژیهای دیگری (نظیر منطق فازی و گروه بندی) نیز برای انتخاب قوانینی که باید به کار گرفته شوند٬ جهت تسهیل انتخاب هوشمندانه ی قوانین استفاده می کنند. یکی از مزایای قابل توجه تکنولوژی سیستم های خبره٬ توانایی آنها در تشریح فرایند تصمیم سازی و حل مساله شان می باشد. سیستم های خبره می توانند قوانینی  که در طی یک فرایند حل مساله از آنها استفاده شده است را ثبت کرده و برای تشریح روند استدلال انجام شده آنها را ارائه دهند. این قابلیت مدت ها به عنوان عنصر کلیدی در تکنولوژی سیستم های خبره و یکی از انگیزه های اصلی در پیاده سازی و استفاده از آنها محسوب می شد.

نوشته شده در چهارشنبه 12 بهمن 1384 و ساعت 10:02 ق.ظ توسط : محمد حسین هراتیان
ویرایش شده در چهارشنبه 12 بهمن 1384 و ساعت 10:02 ق.ظ


¿سیستم های خبره - ۱
سه شنبه 11 بهمن 1384

یک سیستم خبره را می توان اینگونه تعریف کرد: یک برنامه ی هوشمند کامپیوتری که برای حل مسایلی که دشوار تر از آن هستند که به کمک مهارت انسانی (حتی به میزان بسیار زیاد) حل شوند؛ از دانش استفاده کرده و به استنتاج از رویه ها می پردازد. یک انسان عادی در طول زمان و در طی فرایند تبدیل به یک کارشناس (خبره)؛ تجارب بسیار زیادی در زمینه ی مهارتی خود بدست خواهد آورد. این تجارب در حل مسایلی که کارشناس با آنها روبرو خواهد شد به کمک وی می آیند. سیستمهای خبره روشی را ارایه می دهند که با آن می توان به کسب؛ کدگزاری و استفاده ی مجدد از این تجارب پرداخت.

یک سیستم خبره اساسا شامل بازنمایی هایی از مهارت؛ باز نمایی هایی از مساله ای که باید حل شود و مکانیزم هایی جهت به خدمت گرفتن مهارت برای حل مساله می باشد. با وجود اینکه می توان مهارت را به فرمهای مختلفی بازنمایی کرد؛ یک شیوه ی متداول؛ استفاده از قوانین می باشد. باز نمایی دانش یک کارشناس باید به شکل مجموعه قوانینی باشد که از کارشناس گرفته شده است.

هر قانون از دو بخش تشکیل شده است: مقدم و تالی. مقدم شامل یک یا چندین شرط می باشد که مشخص می کنند کی و کجا باید این قانون را بکار گرفت. اگر شرطهای قانون برآورده شد؛ آنگاه بخش دوم قانون تعیین می کند که چه اتفاقی باید بیافتد.

به عنوان مثال می توان در بحث عیب یابی یک اتومبیل قانون زیر را در نظر گرفت: اگر اتومبیل بنزین داشته باشد؛ و کلید در محل مخصوص قرار گرفته و در جهت مناسب استارت زدن گردانده شده باشد و موتور روشن نشده باشد؛ آنگاه باید بررسی کرد که آیا موتور جام کرده است یا خیر. این قانون زمانی به کار می آید که ماشین بنزین دارد و کلید در جهت صحیح پیچانده شده اما ماشین روشن نشده است. عملیات مذکور(بررسی موتور) خود بررسی های بیشتری برای کشف مشکل ارائه می دهد.

نوشته شده در سه شنبه 11 بهمن 1384 و ساعت 03:01 ق.ظ توسط : محمد حسین هراتیان
ویرایش شده در - و ساعت -


¿هستان شناسی - ۲ ادامه
پنجشنبه 1 دی 1384

در این روش برای معرفی یک نوع جدید کافی است فرا نوع آن و وجوه تمایز آن با سایر زیر نوع های آن ابر نوع را بیان نمود. این روش امروزه استانداردی برای ساخت فرهنگ های زبان طبیعی شده و در سیستمهای مبتنی بر دانش و برنامه نویسی شی گرا نیز کاربرد دارد.

ارسطو همچنین در کتابهایش در زمینه ی منطق، روشی برای استدلال در مورد طبقات، به نام Syllogism معرفی نموده که تعیین می کند چگونه وجوه تمایز از ابر نوع ها به زیر نوع ها در سلسله مراتب طبقات به ارث می رسد. لذا منطق ارسطو که یک نظریه ارث بری است، بسیار شبیه به عملکرد شبکه های معنایی در هوش مصنوعی می باشد. گرچه ارسطو هرگز برای توصیف طبقاتی که معرفی نمود شبکه معنایی رسم نکرد ولی قرنها بعد در قرن سوم میلادی فیلسوفی به نام پرفیری از چنین شبکه برای نمایش سلسله مراتب طبقات از دید ارسطو استفاده نمود. این شبکه که برای نوع های تحت "ماده" رسم شده در شکل پست قبل نشان داده شده است. در این شکل دسته ها با حروف تمام بزرگ و وجوه تمایز با حروف کوچک نشان داده شده اند.

همان طور که در شکل دیده می شود، در سطوح این سلسله مراتب به شکل یک در میان، وجوه تمایز و دسته های تولید شده بر اساس این وجوه قرار گرفته اند. برای مثال دسته ی اصلی (ریشه درخت) که "واقعیت مادی" است، با وجه تمایز مادیت و غیر مادیت(معنویت) به دو دسته وابسته و فرعی به نام های "بدن" و "روح" تقسیم می شود. دسته فرعی بدن خود با وجه تمایز جاندار و غیر جاندار بودن به دو دسته فرعی دیگر به نام های "جاندار" و "جماد" تفکیک می گردد. و این تقسیم بندی تا رسیدن به برگ ها که در آن نمونه ها و افراد تحت دسته انسان مانند سقراط، افلاطون و ارسطو واقع شده اند ادامه دارد.

نوشته شده در پنجشنبه 1 دی 1384 و ساعت 03:12 ق.ظ توسط : محمد حسین هراتیان
ویرایش شده در - و ساعت -


¿هستان شناسی - ۲
چهارشنبه 30 آذر 1384

Supreme Genus:                                         SUBSTANCE
                                                                   /                  \
Differentiae:                                       material              immaterial
                                                                   \                          \
Subordinate genera                                BODY                  SPIRIT
                                                                   /         \
Differentiae:                                    animate          inanimate
                                                                   \                       \
Subordinate genera                                LIVING             MINERAL
                                                               /           \
Differentiae:                               sensitive           insensitive
                                                                \                     \
Proximate genera:                                 ANIMAL          PLANT
                                                             /            \
Differentiae:                                rational            irrational
                                                              \                      \
Human:                                              HUMAN            BEAST
                                                           / |  | \                   
Individuals:                          Socrates   |  |  etc.
                                                       Plato Aristotle


نمایش سلسله مراتب طبقات از دید ارسطو

نوشته شده در چهارشنبه 30 آذر 1384 و ساعت 08:12 ق.ظ توسط : محمد حسین هراتیان
ویرایش شده در - و ساعت -


¿هستان شناسی - ۱
دوشنبه 21 آذر 1384

هستان شناسی (Ontology) یکی از متدولوژی های متداول برای پیاده سازی پایگاه های دانش می باشد. متدولوژی های دیگری مثل سیستم های خبره (Expert System) و استدلال مبتنی بر مورد (Case-Based Reasoning) نیز وجود دارند که در پست های بعدی به معرفی آنها خواهم پرداخت. یادداشت زیر، بخشی از کتاب منتشر نشده ی خانم دکتر شمس فرد می باشد که به بررسی هستان شناسی می پردازد.

برای هستان شناسی در متون، قلمروها و کاربرد های مختلف، تعاریف متفاوتی ارائه شده است. تعریف هستان شناسی در فرهنگ لغات به صورت  ّ شاخه ای از متافیزیک که طبیعت وجود را مطالعه می کند ّ و  ّ نظریه مشخصی در مورد طبیعت ‌بودن یا انواع وجود ّ آمده است (Webster, 1989). در فلسفه، هستان شناسی اشاره به «نظریه وجود» دارد. به عبارت دیگر، نظریه ای است که می تواند به سوالاتی چون ّوجود چیستّ، ّچه ویژگی هایی در همه موجودات مشترک هستندّ، ّچه ویژگی هایی می توانند وجود را توصیف کنندّ و ّچگونه این ویژگی ها وجود را توصیف می کنندّ پاسخ دهد (Guarino, 1995). به بیان دیگر، هستان شناسی شاخه ای از فلسفه است که به «طبیعت بودن و وجود» مربوط می شود و در حدود ۲۵ قرن تلاش فلسفه را در پشت خود دارد. گرچه کار بر روی طبیعت وجود به بیش از شش قرن پیش از میلاد مسیح بر می گردد و فلاسفه ای چون هراکلیتوس و افلاطون در غرب و بودا و کنفیسیوس در شرق در قرن های پنجم و ششم قبل از میلاد در این زمینه نظراتی ارائه کرده اند، ولی پایه گذاری علم هستان شناسی به نام ارسطو (۳۸۴ - ۳۲۲ ق . م ) ثبت شده است. ارسطو نخستین فیلسوفی بود رفتار نظام یافته ای با منطق و هستان شناسی داشت. وی به یکی از مباحث اصلی علم هستان شناسی که طبقه بندی هر آنچه وجود دارد به طبقات و کلاسهای اصلی است توجه کرده، هر آنچه وجود دارد را به ۱۰ طبقه اصلی تقسیم نمود که عبارن اند از : واقعیت مادی، کمیت، کیفیت، ارتباط، مکان، زمان، موقعیت، حالت، کنش، و تاثیر. وی همچنین روشی برای تعریف طبقات جدید با تعریف ابر نوع یا دسته (genus) و وجه تمایز (differentia) که عامل افتراق و تمایز میان نوع های جدید و زیر نوع های دیگر یک دسته است، معرفی نمود. وجه تمایز، ویژگی ها یا مشخصه هایی هستند که یک نوع را از انواع دیگری که با آن تحت ابر نوع مشترک قرار دارند، متمایز می کنند.

نوشته شده در دوشنبه 21 آذر 1384 و ساعت 01:12 ب.ظ توسط : محمد حسین هراتیان
ویرایش شده در - و ساعت -


¿تحلیل سبد خرید: داده کاوی در خصوص مجموعه اقلام تکرار شونده
جمعه 18 آذر 1384

سلام دوباره خدمت دوستان عزیز! از اونجا که مریم توی کامنت شون نوشته بودن که دوستمون ظاهرا دنبال مثال های عملی در خصوص داده کاوی هستن، من از ذکر مطالب تئوری و پایه صرف نظر کرده و یکی از مثال های بسیار متداول در بحث داده کاوی، یعنی «شمارش هم پیشامد ها » رو مطرح می کنم. امیدوارم که دوستمون بتونن استفاده کنن و همچنین ما رو هم از یافته ها و ترجمه های خودشون بی نصیب نگذارن.

بحث را با طرح مساله ی شمارش اقلام هم پیشامد که منشا آن مسائلی نظیر تحلیل سبد خرید می باشد، آغاز می کنیم. یک سبد خرید مجموعه اقلامی می باشد که توسط یک مشتری و در یک «تراکنش مشتری» خریداری شده اند. یک تراکنش مشتری شامل یک بار بازدید از فروشگاه، یک سفارش از طریق کاتالوگ پست شده، یا یک سفارش در یک فروشگاه مجازی روی وب می باشد. (من در این پست معمولا عبارت «تراکنش» را به جای «تراکنش مشتری» به کار خواهم برد. البته در مواقعی که تداخلی با معنای متداول تراکنش در DBMS وجود نداشته باشد). یکی از اهداف متداول فروشندگان، تشخیص کالاهایی است که با یکدیگر خریداری شده اند. این اطلاعات برای چینش بهتر کالاها در قفسه های فروشگاه و یا طراحی صفحات کاتالوگ مورد استفاده قرار می گیرند.

                        transid            cutid             date               item             qty

                        -------------------------------------------------------------------

                        111                  201              5/1/99           pen               2
                        111                  201              5/1/99           ink                 1
                        111                  201              5/1/99           milk               3
                        111                  201              5/1/99           juice              6

                        -------------------------------------------------------------------
                        112                  105              6/3/99           pen               1 
                        112                  105              6/3/99           ink                 1
                        112                  105              6/3/99           milk               1

                        -------------------------------------------------------------------
                        113                  106              5/10/99         pen               1
                        113                  106              5/10/99         milk               1

                        --------- ----------------------------------------------------------
                        114                  201              6/1/99           pen               2
                        114                  201              6/1/99           ink                 2
                        114                  201              6/1/99           juice              4

مجموعه اقلام تکرار شونده

از روابط خرید نشان داده شده در شکل برای کشف مجموعه اقلام تکرار شونده استفاده خواهد شد. رکوردهای جدول به صورت گروه بندی شده بر اساس فیلد مرتب شده اند. تمامی تاپل های یک گروه دارای یک TransID می باشند. یک تراکنش در تاریخ مشخصی رخ می دهد و نام هر جنس خریداری شده به همراه تعداد آن نیز ثبت می گردد. همان طور که مشاهده می شود در جدول فوق افزونگی وجود دارد. با ذخیره کردن جداگانه ی TransID_CustID و حذف CustID از جدول اولیه، این افزونگی از بین خواهد رفت؛ که احتمالا داده ها عملا به همین فرم ذخیره می شوند. اما به هر حال بهتر است که روابط خرید را به صورت نشان داده شده در شکل بیان کنیم تا بتوانیم مجموعه اقلام تکرار شونده را راحت تر تشخیص دهیم. ساخت چنین جدول های غیر نرمال شده ای برای سهولت داده کاوی معمولا در مرحله ی «تمیز کردن داده» از فرایند KDD انجام می شود. با بررسی مجموعه گروههای تراکنش در جدول خرید, می توان دریافت که: « در 75% از تراکنشها Pen  و Ink  با یکدیگر خریداری شده اند». این گزاره ای است که تراکنشهای موجود در پایگاه داده را توصیف می کند. تعمیم به تراکنشهای بیشتر می بایست با احتیاط صورت گیرد که در این باره در پست های بعدی صحبت خواهم کرد. اجازه دهید تا با معرفی واژه شناسی تحلیل سبد خرید بحث را ادامه دهیم. یک « مجموعه اقلام» از تعدادی کالا تشکیل شده است. « Support » ا هر مجموعه اقلام, عبارت است از نسبت تعداد تراکنش هایی که شامل تمامی کالا های موجود در مجموعه اقلام هستند به تعداد کل تراکنش های پایگاه داده. در مثال فوق مجموعه اقلام {pen, ink} در نظر گرفته شد و دیدیم که Support این مجموعه اقلام 75% بود. بنابر این می توانیم نتیجه بگیریم که Pen  و ink عمدتا با هم خریداری می شوند. اگر مجموعه اقلام {milk, juice} را در نظر بگیریم مشاهدا می شود که Support  آن تنها 25% است. بنابر این milk  و ink  معمولا باهم خریداری نمی شوند. در بیشتر اوقات مجموعه هایی از اجناس که عمدتا با یکدیگر خریداری می شوند, کم هستند. به خصوص زمانی که اندازه ی مجموعه اقلام افزایش یابد. اما آنچه برای ما اهمیت دارد کشف تمامی مجموعه اقلامی است که Support  آنها از یک Support حداقل که توسط کاربر مشخص می شود بیشتر باشد. (واسهSupport  اگه معادل خوبی سراغ دارین پیشنهاد بدین). این Support حداقل, minsup خوانده می شود و چنین مجموعه اقلامی «مجموعه اقلام تکرار شونده». برای مثال اگه minsup رو 70% در نظر بگیریم, آنگاه مجموعه اقلام تکرار شونده به شرح زیر خواهند بود: {pen}, {milk}, {ink}, {pen, ink}, {pen, milk}. توجه داشته باشین که مجموعه اقلامی که تنها شامل یک کالا می باشند نیز برای ما اهمیت دارند, چرا که نشان دهنده ی اقلامی می باشند که متناوبا خریداری شده اند. الگوریتمی که برای شناسایی مجموعه اقلام تکرار شونده مورد استفاده قرار می گیرد رو در پست های بعدی می فرستم. این الگوریتم بر مبنای یک ویژگی ساده و در عین حال اساسی مجموعه اقلام تکرار شونده استوار است: «هر زیرمجموعه از یک مجموعه اقلام تکرار شونده خود نیز باید یک مجموعه اقلام تکرار شونده باشد».

 

نوشته شده در جمعه 18 آذر 1384 و ساعت 03:12 ق.ظ توسط : محمد حسین هراتیان
ویرایش شده در شنبه 19 آذر 1384 و ساعت 06:12 ق.ظ


¿Introduction of Data Mining
چهارشنبه 16 آذر 1384

کاوش داده به زیر شاخه ای از علم آمار به نام « تحلیل اکتشافی داده» ( Exploratory Data Analysis ) مرتبط است که در حوزه ی ارقام آماری، اهداف و رویکرد های مشابهی با یکدیگر دارند. همچنین با بخش هایی از علم هوش مصنوعی بنام کشف دانش (Konwledge Discovery)  و یادگیری ماشین (Machine Learning) ارتباط بسیار تنگاتنگی دارد. اما ویژگی مهم و متمایز داده کاوی آن است که با حجم داده ی بسیار بالایی سر و کار دارد. با این وجود ایده ها و تکنیک های این حوزه های مطالعاتی مرتبط، در مسایل داده کاوی نیز قابل استفاده هستند. مقیاس پذیری به نسبت سایز داده (Scalability with Respect to data Size) یک معیار مهم و جدید در مفاهیم کاوش داده است. یک الگوریتم مقیاس پذیر، الگوریتمی است که در آن زمان اجرا به صورت خطی و به نسبت اندازه ی مجموعه داده - و به طور خاص، منابع سیستمی موجود ( مثلا اندازه ی حافظه ی اصلی و دیسک) - رشد کند. برای تضمین مقیاس پذیری، می بایست الگوریتم های قدیم تغییر و الگوریتم های جدید توسعه داده شوند.

«یافتن روشها و الگو های مفید در پایگاه های داده» تعریف نسبتا ضعیفی از داده کاوی است. در واقع می توان تصور کرد که تمامی جستجو های پایگاه داده چنین هستند. اما در حقیقت ما با زنجیره ای از ابزار های تحلیلی و اکتشافی سر و کار داریم که پرس و جو های SQL در یک سوی آن، پرس و جو های OLAP در میان و تکنیک های داده کاوی در سویی دیگر از این زنجیره قرار دارند. پرس و جوهای SQL با استفاده از جبر رابطه ای (البته با اندکی بسط) ساخته می شوند؛ OLAP سطح بالاتری از جستجو و بر اساس مدل داده ای چند بعدی را فراهم می کند؛ و داده کاوی به ارایه ی انتزاعی ترین عملیات های تحلیلی می پردازد. عملایت های مختلف داده کاوی را می توان به صورت زیر تعبیر کرد : «پرس و جو» های پیچیده ای که در سطحی بالا تعیین شده اند، با پارامتر هایی که قابل تعریف توسط کاربر هستند و الگوریتم های مشخصی که برای آنها پیاده سازی شده است.

نوشته شده در چهارشنبه 16 آذر 1384 و ساعت 03:12 ق.ظ توسط : محمد حسین هراتیان
ویرایش شده در - و ساعت -


¿مقدمه ای بر داده کاوی
چهارشنبه 16 آذر 1384

رمز موفقیت در دانستن چیزهایی است که دیگران نمی دانند.

                                                                                     اوناسیس

داده کاوی عبارت است از کشف روشها و الگوهایی ویژه در پایگاه داده های بزرگ، برای هدایت تصمیم گیری در مورد فعالیت های آینده. انتظار می رود که ابزار های داده کاوی بتوانند این الگو ها را با دریافت کمترین ورودی از کاربر تشخیص دهند. الگوهای ارایه شده می توانند درک مفید و غیر قابل انتظاری در اختیار یک تحلیل گر داده قرار دهند تا متعاقبا توسط دیگر ابزار های تصمیم سازی (Decision Support) و با دقت بیشتری مورد بررسی قرار گیرند. در پست های بعدی به بررسی حوزه های مختلف داده کاوی خواهم پرداخت. کمپانی های بزرگ برای هر کدام از این حوزه ها، ابزار های قدرتمندی به بازار عرضه کرده اند و اهمیت استفاده از داده کاوی به خاطر مقبولیت آن در بین کاربران روز به روز در حال افزایش است.

نوشته شده در چهارشنبه 16 آذر 1384 و ساعت 03:12 ق.ظ توسط : محمد حسین هراتیان
ویرایش شده در - و ساعت -


¿باز هم بحث حیطه ی مدیریت دانش
یکشنبه 13 آذر 1384

چند وقت پیش سوال و جوابی در خصوص حیطه ی مدیریت دانش شده بود و آقای کیهانی عبارت مدیریت دانش  رو محدود به چارچوبهای یک سازمان دانسته بودن. و اظهار کرده بودن که مدیریت دانش در بیرون از مرز های یک سازمان نیز قابل پیاده سازی است ولی دیگه اسمش مدیریت دانش نیست.  من معتقدم که هر جا بحث دانش مطرح باشه (منظور,  دانش به اون معنای تعریف شده و جامع است که در حوزه های غیر مدیریتی مثل IT  نیز وجود دارد و نه صرفاً دانش مدیریتی), خود به خود بحث مدیریت این دانش (با حفظ عنوان مدیریت دانش) هم به دنبال اون مطرح می شه. مثال های زیادی در این زمینه وجود داره : مثل دانش کسب شده توسط یک عامل (Agent)  از محیط پیرامون خود در بحث روبوتیک , و یا دانش موجود در یک سیستم خبره (Expert System) برای عیب یابی اتومبیل و رفع اون عیب و صد ها مثال دیگر که در اونها ما با دانشی مواجهیم که برای استفاده از آن نیازمند مدیریت آن هستیم. ( در خصوص سیستم های خبره یه مقاله ترجمه کرده ام که بزودی اون رو در وبلاگ خواهم گذاشت, ضمن اینکه از دوستان خواهش دارم اگر که مقاله یا مطلب ترجمه شده ای در خصوص مدیریت دانش دارن, ترجمه ی اون رو در وبلاگ قرار بدن تا بقیه هم استفاده کنن). بر گردیم به بحثمون: تو همون مقاله ای که گفتم, فرایند های دانش مختلفی از نویسندگان و محققان مختلف به صورت تیتر وار مطرح شده که هر کدوم در بر دارنده ی Task  های مختلفی هستن. اما نویسنده (Rosina Weber & Randy Kaplan)  یک فرایند مفهومی کلی رو در بین همه ی اینها دیده که تو همشون مشترکه :

 این چرخه رو در هر سیستم مبتنی بر پایگاه دانش می توان در نظر گرفت. پایگاه دانشی که الزاماً در حصار یک سازمان محدود نشده. اگه قبول کنیم که چرخه ی بالا به تعبیری همان مدیریت دانش است, پس باید بپذیریم که مدیریت دانش در حوزه های دیگری نیز غیر از حوزه های سازمانی قابل تعریف و پیاده سازی است.

و اما باز بحث واژه ها :

شاید اگه من به جای واژه ی «خلق دانش» برای عبارت Knowledge Creation  , از - مثلاً – ساخت دانش استفاده می کردم, کمتر حساسیت بر انگیز می شد. به طور کلی Knowledge Creation   بر چگونگی بوجود آمدن دانش در فرایند های سازمان و در پایگاه های دانش تمرکز دارد. اما بدیهی است که این دانش از چیزی که قبلاً وجود نداشته تولید نمی شود. لذا موافقم که «خلق دانش» خالی از اشکال نیست. اما آنچه مسلمه اینه که عبارت هایی مثل K Acquisition  (کسب دانش), Synthesis  (ترکیب) , Fusion  ( آمیزش) تعاریف دیگه ای داره و ما به هر حال ناچاریم برای Knowledge Creation   از یه معادل مناسب استفاده کنیم.

 برای Creativity System  هم معادلی پیشنهاد نشد.

 توی این چرخه ی مفهومی, واسه Understand  چی پیشنهاد می کنین؟ در توضیح این فاز آمده بود :

            K Understanding  شامل صحه گذاری (Verification) , بازنمایی (Representation) , تلفیق (Synthesis) , انطباق (Adaptation)  , ذخیره سازی و سازمان دهی دانش جدید با دانشهای موجود درون سازمان می باشد. برای آنکه دانش جدید توسط افراد درون سازمان قابل استفاده باشد, باید آنرا در قالبی قابل قبول و قابل فهم توسط سازمان و نیروها, با دانش موجود در سازمان ترکیب کرد.

نوشته شده در یکشنبه 13 آذر 1384 و ساعت 11:12 ق.ظ توسط : محمد حسین هراتیان
ویرایش شده در یکشنبه 13 آذر 1384 و ساعت 11:12 ق.ظ


¿چند واژه جدید
سه شنبه 8 آذر 1384

سلام به دوستان وبلاگ مدیریت دانش! بسیار خوشحال هستم که خودم رو در جمع شما می بینم. به عنوان اولین پست یه سری از واژه هایی که برای اونها معادلی در لیست واژه ها ندیدم رو می نویسم.

Data Warehouse                           انبار داده/انباره داده

Data Warehousing                        انبار سازی داده                         

Expert System                              سیستم خبره

Knowledge Acquisition                  کسب دانش

Knowledge Discovery                    کشف دانش 

Data Mining                                   کاوش داده

Ontology                                       هستان شناسی

Creativity System                         سیستم خلاقه

Knowledge Creation                      خلق دانش

کسی معادل مناسبی برای واژه های Case-Based Reasoning و Brainstorming  سراغ داره؟؟

نوشته شده در سه شنبه 8 آذر 1384 و ساعت 07:11 ق.ظ توسط : محمد حسین هراتیان
ویرایش شده در سه شنبه 8 آذر 1384 و ساعت 08:11 ق.ظ