אנחנו עובדים על שחזור אפליקציית Unionpedia ב-Google Play Store
יוֹצֵאנִכנָס
🌟פישטנו את העיצוב שלנו לניווט טוב יותר!
Instagram Facebook X LinkedIn

כריית טקסט

מַדָד כריית טקסט

כריית טקסט (באנגלית: Text Mining) המכונה גם כריית נתונים של טקסט, היא תהליך של הפקת מידע איכותי מטקסט. [1]

תוכן עניינים

  1. 32 יחסים: IBM, Weka (למידת מכונה), מסמך, מסד נתונים, מודיעין עסקי, מיקרוסופט, אנגלית, אלגוריתם, ניתוח מחרוזות, ניתוח מילולי, ניתוח אשכולות, ניתוח סנטימנט, סטטיסטיקה, סיווג (סטטיסטיקה), עיבוד שפה טבעית, פייתון, רשת סמנטית, רונן פלדמן, שפה טבעית, למידת מכונה, זיהוי שם ישות, זיהוי תבניות, חלבון, בלשנות, בינה עסקית, ביטחון לאומי, ביטוי רגולרי, דואר אלקטרוני, הקשר, הדמיית נתונים, הורדת ממד, כריית מידע.

IBM

ניו יורק לוח הבקרה של מחשב Main-Frame מדגם 65 של מערכת/360 מקלדת וראש בעברית IBM קורפוריישן (ראשי התיבות של "International Business Machines") הוא תאגיד רב-לאומי אמריקאי, שמרכזו במדינת ניו יורק, והוא מהווה את אחד התאגידים הגדולים והוותיקים בעולם המחשוב, ובמשך שנים רבות היה הגדול בתחום זה.

לִרְאוֹת כריית טקסט וIBM

Weka (למידת מכונה)

Weka (ראשי התיבות של Waikato Environment for Knowledge Analysis; מבוטא בחריזה עם המילה "מכה") היא חבילה פופולרית של התוכנות הנפוצות ללמידת מכונה, שנכתבו בשפת Java, שפותחה באוניברסיטת Waikato, ניו זילנד.

לִרְאוֹת כריית טקסט וWeka (למידת מכונה)

מסמך

מסמכי רישום לידות בקהילה היהודית, ביאליסטוק, 1859 מסמך הוא מצג המתעד עובדות או רעיונות.

לִרְאוֹת כריית טקסט ומסמך

מסד נתונים

סכמה של מסד הנתונים של מדיה ויקי מנהל מסד נתונים Hsql תוכנת PhppgAdmin לניהול מסד נתונים מסך ניהול של מסד נתונים MySQL מסד נתונים (באנגלית: Database - דַּאטָה־בֵּייס, או בראשי תיבות DB, "בסיס נתונים") הוא אמצעי המשמש לאחסון מסודר של נתונים במחשב, לשם אחזורם ועיבודם.

לִרְאוֹת כריית טקסט ומסד נתונים

מודיעין עסקי

מודיעין עסקי הוא איסוף וניתוח של מידע על השוק שבו פועל תאגיד מסוים, כבסיס לקבלת החלטות עסקיות.

לִרְאוֹת כריית טקסט ומודיעין עסקי

מיקרוסופט

תאגיד מיקרוסופט (באנגלית: Microsoft Corporation) היא חברת תוכנה, מחשבים ומוצרי אלקטרוניקה אמריקאית רב-לאומית, שבסיסה ברדמונד, ליד העיר סיאטל שבמדינת וושינגטון, ארצות הברית.

לִרְאוֹת כריית טקסט ומיקרוסופט

אנגלית

אנגלית (באנגלית: English) היא שפה ממשפחת השפות הגרמאניות שמקורה באנגליה, והיא אחת השפות המדוברות ביותר בעולם.

לִרְאוֹת כריית טקסט ואנגלית

אלגוריתם

אלגוריתם הוא דרך שיטתית וחד-משמעית לביצוע של משימה מסוימת, במספר סופי של צעדים.

לִרְאוֹת כריית טקסט ואלגוריתם

ניתוח מחרוזות

ניתוח מחרוזות (אנגלית Parsing) הוא תהליך ניתוח מחרוזות של סמלים, בשפה טבעית או בשפת מחשב, תוך שמירה על כללי דקדוק.

לִרְאוֹת כריית טקסט וניתוח מחרוזות

ניתוח מילולי

במדעי המחשב, ניתוח מילולי (באנגלית: Lexical analysis) הוא השלב הראשון בתהליך ההידור, בו מתורגם הקוד שכתוב בשפה עילית לשפת מכונה.

לִרְאוֹת כריית טקסט וניתוח מילולי

ניתוח אשכולות

בכריית מידע, סטטיסטיקה ולמידה חישובית, ניתוח אשכולות (באנגלית: Cluster Analysis) מתייחס למשימה של קיבוץ אובייקטים לקבוצות (אשכולות) כך שהאובייקטים הנמצאים באותה קבוצה דומים זה לזה יותר מאשר לאובייקטים השייכים לקבוצות אחרות.

לִרְאוֹת כריית טקסט וניתוח אשכולות

ניתוח סנטימנט

ניתוח סנטימנט (הידוע גם ככריית דעות או כבינה מלאכותית רגשית) הוא השימוש בעיבוד שפה טבעית, כריית טקסט, בלשנות חישובית וביומטריה כדי לזהות, לחלץ, לכמת ולחקור מצבים רגשיים ומידע סובייקטיבי באופן שיטתי.

לִרְאוֹת כריית טקסט וניתוח סנטימנט

סטטיסטיקה

גרף התפלגות נורמלית סטטיסטיקה היא תחום ידע הנוגע לאיסוף, עיבוד, ניתוח, והצגת מסקנות מנתונים כמותיים.

לִרְאוֹת כריית טקסט וסטטיסטיקה

סיווג (סטטיסטיקה)

בסטטיסטיקה ובלמידת מכונה, סיווג הוא פעולה שמחלקת קבוצת עצמים לתת-קבוצות.

לִרְאוֹת כריית טקסט וסיווג (סטטיסטיקה)

עיבוד שפה טבעית

עיבוד שפה טבעית (באנגלית: Natural Language Processing - NLP) הוא תת-תחום של בינה מלאכותית ובלשנות.

לִרְאוֹת כריית טקסט ועיבוד שפה טבעית

פייתון

פייתון (באנגלית: Python) היא שפת תכנות עילית דינמית למטרות כלליות מהנפוצות ביותר, ומדורגת באופן עקבי כאחת משפות התכנות הפופולריות ביותר.

לִרְאוֹת כריית טקסט ופייתון

רשת סמנטית

רשת סמנטית (באנגלית: Semantic network או Semantic web) היא מסד נתונים רשתי שמכיל את הקשרים הסמנטיים בין מרכיביו.

לִרְאוֹת כריית טקסט ורשת סמנטית

רונן פלדמן

רונן פלדמן (נולד ב-5 ביוני 1962) הוא פרופסור בבית הספר למנהל עסקים של האוניברסיטה העברית בירושלים.

לִרְאוֹת כריית טקסט ורונן פלדמן

שפה טבעית

שפה טבעית היא שפת הדיבור של בני האדם.

לִרְאוֹת כריית טקסט ושפה טבעית

למידת מכונה

למידת מכונה (באנגלית: Machine Learning; לעיתים מכונה גם למידה חישובית) היא תת-תחום במדעי המחשב ובבינה מלאכותית המשיק לתחומי הסטטיסטיקה והאופטימיזציה.

לִרְאוֹת כריית טקסט ולמידת מכונה

זיהוי שם ישות

#הפניה זיהוי ישויות.

לִרְאוֹת כריית טקסט וזיהוי שם ישות

זיהוי תבניות

זיהוי תבניות הוא תהליך זיהוי של כללים או דפוסים וסדירויות בנתונים מורכבים.

לִרְאוֹת כריית טקסט וזיהוי תבניות

חלבון

מבנה רביעוני של חלבון קטלאז, המתפקד כאנזים חלבון (בלועזית: פרוטאין, מיוונית - πρώτειος, פְּרוֹטַאִיוֹס - "ראשוני") הוא תרכובת אורגנית גדולה ומורכבת יחסית, הבנויה משרשרת מקופלת של חומצות אמיניות הקשורות ביניהן בקשרים פפטידיים בין הקבוצה הקרבוקסילית של החומצה האמינית לקבוצה האמינית של החומצה השנייה.

לִרְאוֹת כריית טקסט וחלבון

בלשנות

בַּלְשָׁנוּת או לשונאות (ובלעז לִינְגְּוִויסְטִיקָה) היא חקר שפה טבעית אנושית, וחקר היכולת האנושית להשתמש בשפה.

לִרְאוֹת כריית טקסט ובלשנות

בינה עסקית

בינה עסקית (באנגלית: Business intelligence, בראשי תיבות: BI) היא תחום בטכנולוגיית המידע העוסק בבניית מערכות העוזרות לארגון להפיק מידע משמעותי מבחינה עסקית מתוך מכלול הנתונים הנאספים על ידיו.

לִרְאוֹת כריית טקסט ובינה עסקית

ביטחון לאומי

ביטחון לאומי הוא יכולתה של אומה להגן על אזרחיה ועל ערכיה הפנימיים מפני איומים חיצוניים, כגון ארגוני טרור ומדינות עוינות.

לִרְאוֹת כריית טקסט וביטחון לאומי

ביטוי רגולרי

ביטוי רגולרי (מאנגלית: Regular expression או regex) הוא רצף תווים שמגדיר תבנית חיפוש.

לִרְאוֹת כריית טקסט וביטוי רגולרי

דואר אלקטרוני

eM Client תרשים המציג תנועה של דואר אלקטרוני דואר אלקטרוני (בראשי תיבות: דוֹאֶ"ל; באנגלית: E-mail ובקיצור בעברית מייל או אִימֵיְיל) הוא אמצעי תקשורת אלקטרוני המאפשר העברת מסרים כתובים דרך שרתים ממחשב אחד למחשבים אחרים המחוברים לרשת.

לִרְאוֹת כריית טקסט ודואר אלקטרוני

הקשר

הֶקְשֵׁר, ובלועזית: קוֹנְטֶקְסְט (context), הוא טקסט הסמוך אל טקסט מסוים, לפניו או אחריו, שיש ביניהם קשר ומשמעות ישירה.

לִרְאוֹת כריית טקסט והקשר

הדמיית נתונים

היסטוריית בחירות לכנסת ישראל 2019-1948 הדמיית נתונים (באנגלית: Data visualization; על פי האקדמיה ללשון העברית: הַחְזָיַת נתונים) היא מדע שימושי בין תחומי, המאחד בתוכו ידע ומחקרים ממדעי ניהול, נתונים, בלשנות, פסיכולוגיה קוגניטיבית, תקשורת חזותית ומחשב.

לִרְאוֹת כריית טקסט והדמיית נתונים

הורדת ממד

בסטטיסטיקה, למידת מכונה ותורת האינפורמציה, תהליך הורדת ממד (dimensionality reduction) הוא תהליך של צמצום מספר משתנים מתוך כלל המידע, על מנת לשמר כמה שיותר מהמשמעות של המידע עצמו.

לִרְאוֹת כריית טקסט והורדת ממד

כריית מידע

כריית מידע או כריית נתונים (באנגלית: Data mining) היא הפעלת אלגוריתם או תוכנית מחשב לצורך גילוי מידע הטמון בבסיסי נתונים קיימים, והסקת מסקנות מהצלבתו.

לִרְאוֹת כריית טקסט וכריית מידע

אזכור

[1] https://he.wikipedia.org/wiki/כריית_טקסט