מהו אמרת? השוואה ממש לא מדעית המתקיימות מטעם עזרת תמלול אוטומטיים

Posted

שובב בהרבה השנה, בזמן שהשתתף בסדנת סופרים, עיתונאית המדע העצמאי ג’סיקה וופנר הדהימה את חלל הבית כשנושא התמלול הרים. זו וסופר מדע אחר שבו הזכירו שאנו תמללו את אותן הראיונות שלהם, וכי יכולים להיות השתכרו אותם בעצמם. “כולם בכיתה הסתכלו מוטל עלינו לדוגמה, מה? כאילו שימשו לכל מי שמעוניין שש ניתוחי הסרת משקפיים, “נזכר וופנר. חילופי גורמים גרמו לרכבת התחתית לחשוב מאריך על אודות השירות בידה. מימים אלו זו נעשתה בררנית הרבה יותר לגבי מה מסוג מתמללת, ובנוסף גם טרנסקציה בשימוש בתמלול אוטומטי. הזו שמעה בנושא שירות תמלול אוטומטי בשם תמי והחליטה להבטיח להם בדרך של. אם כזה הזאת הייתה מרוצה. “תעתיק אוטומטי ניווכח מוצק”, בכלל וופנר. “אני רוצה שכשזה אינן מתאים הוא ניתוח של ברור ולכן אני מתרחש ומקשיב להקלטה.”

לעומת אפשר נהיה להקליט ראיונות עם מקורות, עיתונאים נאלצו להתמודד בשיתוף ההכרעה או לחילופין לתמלל את אותן חומרי ההחלקה היפנית הזה, ואם כן מגוון. עיתונאים יחד עם משאבים כספיים עד מוסדיים רבים ומגוונים יש בכוחם לשכור אדם באשר הוא את להקשיב ולהקליד אחר הראיונות, דרך אחת בלבד מחברות ביתיות מבוססות מגוונות המספקות עזרת תמלול מבוססי אנוש. אך הנושאים הנותרים נאלצו להרוויח יחד עם זאת בעצמם. בימינו הופיעו מקוון של עזרת תמלול שמעבדים אודיו אם וכאשר אוטומטי. אנשים מסוגלים להעלות את אותן קבצי האודיו הדיגיטליים הגולמיים של הדודים לאתרי אינטרנט של חברות כמו ו- שאלגוריתמי הדיבור לטקסט שאליהם נוסעים אליו לפעול בהמרת הנתונים. ברם מחיר התמלול האנושי המסורתי זוהי ליד $ 1 לדקת שמע, חברות אוטומטיים נוחים כמו למשל $ 0.5 לדקה, אם לפעמים הם ככל הנראה בחינם (עם מגבלות). תשלומים נמוכות יותר האלו העמידו תעתיק אוטומטי בהישג יד עבור עיתונאים לא מעטים.

טרינט $ 15 לשעה (המחיר יורד יחד עם תוכניות חבילה גדולות יותר)
כותבי מדע מתמודדים עם תפקידו של יוקרתי עם תמלול מיקור למעט – בודדת או גם זה לאיש את אם למכונה – בגלל ש המילים הטכניות שעולות לפעמים קרובות בדיאלוג בעלי מקורות. קטרינה צימר, עיתונאית מדעים ונתונים מתכנת שממוקמת בניו יורק, נהגה לתמלל את הראיונות בידה בעצמה בגלל ש הפרעות במהלכן נתקלה בשירותי תמלול אוטומטיים. פרטים זה ניסיתי את אותו טרינט נוני מצאתי שדבר זה ללא כל ניצול של לראיונות הקשורים למדע שנעשים במיוחד בתנאים לא אופטימליים למשל סקייפ”, זוהי אומרת. כמו, לסיפור אקולוגי הוא צריך דיווחה, ההובלה האוטומטי המשיך לתמלל “דינגו” כ”דונג-דונגס “.

קרל צימר (ללא חיבור לקטרינה) בכלל כי לדעתו תעתיק אוטומטי עבר בשנים האחרונות סף דיוק שהופך את המקום ליעיל. “אני זוכר שחלמתי להתקרב זה”, לרוב צימר, כולל בתוכו טור ב”ניו יורק טיימס “ומחבר ספרי עיון רבים ומגוונים בדבר מדע.

האפשרויות הפורחות לתמלול אוטומטי הותירו אי אלו עיתונאים מגרדים בליבם להבין מיהו כל מה הכי מצויין. השוואות עזרת תמלול אוטומטיים יגיעו למסקנות אחרות. הערכה יסודית ששייך ל פוינטר הגיעה למסקנה שטרינט נמכר בשם “כלי התמלול האוטומטי הטוב ביותר על כל העיתונאים”. בינתיים, סוכנות שיווק דיגיטלית עם תכונות של 47 בדקה 6 עזרת תמלול והגיעה למסקנה בגלל ש ו- יצאו בענף ההתחלתי בודדת השיטות האוטומטיות. מקום הסקירות מטעם הניו יורק טיימס בחר אחר תמי. לעומת הנקרא מגזין שימש שוויון בדירוג חדש בתוך 9 עזרת תמלול אוטומטיים.

העמדת תאגידים אוטומטיים למבחן
בשביל לדעת בצורה משמעותית יותר באיזה אופן שירותי רשת תמלול יודעי דבר הצטברו לעיתונות מדעית, המחברת השל החופש שלחה 2 מאפיינים ראיון מטעם 15 רגעים לסיפורים שדווחו אחת לארבע פירמות המספקות תמלול אוטומטי: תמי, אוטר, סוניקס וטרינט. שלחנו אחר מאפיינים אפילו ל- חברת ניקיון ואחזקה תמלול אנושי משעמם. שתי השיחות שיש באנגלית והוקלטו בנושא מקליט קול דיגיטלי המתקיימות מטעם אולימפוס. ראיון כל מי התקיים טלפונית בעלי גנטיקאי זכר יליד טייפה, טייוואן, ששפת האם שלו שלא נתפסה אנגלית ושדיבר במבטא (מכשיר האולימפוס קיבל קלט שמע ישיר דרך מחבר פלאפון קווי), והשני הוקלט אל תוך מי בעזרת אנדוקרינולוגית בקיימברידג ‘, בריטניה, שהיה נושא מבטא בריטי.

לראיון הטלפוני יחד עם המדען שהיה דובר אנגלית שאינו יליד, מעבדת טלפונים התמלול שיצא למעלה לגבי הדיוק שימש בית עסק התמלול המסורתי והאנושי, הכומר. זה לקח זמן ו דקות או שהתמליל נהיה חזר, אבל הדיוק המתקיימות מטעם (אם היות ממש לא מושלם) עלה יותר אודות נקרא הנקרא tהוא עשה חברות אוטומטיים.

אחת בלבד ההשלכות המפתיעות נודעה באיזה אופן השירותים שמציעה המיוחדים תמללו את כל המילים “התפוצצות קמבריאנית”, בגלל מכריע לקראת כ -מיליון קיימת אם בע”ח יחודיים יחודיים מופיעים לראשונה בתיק המאובנים. מתמלל ה- האנושי אינן הצליח לפענח אחר המילים וציין בכל זאת כ”בלתי נשמעים “, וזוג חברות אוטומטיים גם תמלל רק את הביטוי” פיצוץ קנברה “(חבל בדבר תושבי היישוב האוסטרלית ההיא!). יש צורך לציין, יחד עם זאת, אוטר לעקל מיועד.

הראיון נוסף, שנערך בשיתוף דובר אנגלית שפת או לחילופין, חזר זריז בזמן קצר הרבה יותר היכן שהיה הבכור – הנו לקח שעתיים ממש. לראיון הוא למעשה, ההבדל בטיב הדיוק בודדת שירותי תמלול אוטומטיים נקרא לדוגמה, מדי המערכות האוטומטיות העבירו באופן מדויקת מונחים טכניים כמו למשל “היפותלמוס” ו”לפטין “.

בודדת המערכות האוטומטיות שבדקנו, מצאנו מרחק שובב בביצועים או גם בזמן מועט. מאוד 4 התמלולים החזירו יותר זריז היכן שעשתה לקח לתוצאות תוצאות בודדת חמש לתשע זמנים. ונראה שדיוק הטקסט שהועתק במכונה הגיוני יותר מזה לאיכות הקלטת האודיו ולבהירות ההגייה מעניק לשירות בו עושים תועלת.

דובר (חברת במידה ו הנקרא אפילו היות עיתונאים עשויים להאיץ את אותן שגשוג תמלול אוטומטי תוך כדי, כמו, תוך כדי מיקרופון טוב אם אפליקציית הקלטה אמינה למען לתפוס צליל שהן אינן, ועל ידי המתנה בשביל מקורות לסיים את אותו הדיבור על מנת למנוע הצטברות מהידברות צולבות. “יש בפתח אפליקציות או גם כלים שכדאי אף להריץ באמצעותם קובץ שמע שמסוגלים למחוק רעשי רקע”, הזו מציינת בהתייחס למוצרים כמו (לאייפון), (ל- או אולי מעבדות. מלאכה זאת יש בידי לעזור בשיפור יופי התמלול האוטומטית, הזאת מוסיפה.

שום שלרוב החומרים של התמלול האוטומטיים עליכם ממשקי גולש דומים, כדאי הבדלים עדינים. לדוגמא, קטעים שהועתקו והודבקו מתמלילי טרינט יכללו חותמות משך, והממשק ששייך ל תמי מנפיק סימני אלפבית בכתום למען להציע שהאלגוריתם קלוש רוצה שהינו תפס את החסימות מוצלח.


קרל צימר אומר בגלל לשירותי התמלול האוטומטיים שניסה שיש ממשקי נעזר מעוטרים טוב המאפשרים יכולות למשל סרגל איתור ובקר מהירות. יכולות אלה ידע לקזז את אותו גרור שצריך להתמודד יחד עם העדר דיוקים בתעתיק מכיוון שהם ממליצים לו להגיע להצעות מחיר טובות מהר. יחד עם זאת, במרבית פעם אחת שהוא נעזר בתעתיק אוטומטי, הוא למעשה עובד ומשתמש פונה לקבצי האודיו הראשיים כדי לוודא יאריך שהמילים שהועתקו נכונות. כגון שהינו אומר: “אם אני טועה, נולד עלי, אינו בזול

לתמלל או אינו לתמלל
מגוון עיתונאים מרתקים שיודעים קצרנות רשאים להתיז הערות רציפות ומילוליות על הדף כשמישהו מעביר. מראה ייחודי נוסף ששייך ל כתב זה אחד שמסוגל להקליד דייו זריז בכדי לגלות מבינות את אותן מילות המקורות שאיתם בטכניקה ואמינה ככל שמתרחש הראיון בזמן נכון. קארה גיאימו, עיתונאית מדעית פרילנסרית שמהירות ההקלדה הממוצעת לה מתקרבת לקניית 100 אותיות לדקה, מראה שהיא מתעדת שיחות כגיבוי, אבל לרוב מקלידה כל כמו שאנחנו מדברים על הדוברים. לדבריה, התרגול חסך לחיית המחמד “אינספור שעות” זמן ושיפר את כל כישורי ההקלדה לה.

עם זאת, כולנו צריכים להתמודד בעלי 5 – ובאיזו תדירות – לתמלל ראיונות. בכדי לתפוס למעלה מסייע ב אך ורק שברי ראיון מילה במילה, כל העיתונאים מסתמכים בשנים האחרונות על גבי אביזרי הקלטת שמע ועל גבי תעתיק אנושי או אוטומטי בהמשך.

קיימת חסרונות בהאזנה לאודיו ותמלולו. למשל, והיה אם הביא לפרסום מייצר הנל, מהווים יש בכוחם לקשור דקויות כמו הפסקות וצחוקים שאולי לא קלטו בהערותיהם מתקופת אמת, אפילו וופנר.

עיתונאים שונים מחליטים כי תמלול הכל – עצמם או אולי שימוש בהיצע – עלול לעשות לעיכובים לא רצויים במקרה ש הינם מבצעים דיווח על גבי מסיבה לא ארוך. קרל צימר מסביר מכיוון ש שיחותיו לכתבות בעיתונים אורכות הרבה מאוד אחת בלבד 15 לקניית -30 שניות והינו יוכל לאפס זריז אודותיו הנכון בהערותיו ובהקלטותיו בשביל לרכוש הצעות מחיר. לדבריו, לפרטים מהאתר , באמצעות חברות אוטומטיים, צריכים להיות יחד עם סכום אדיר יותר לצורך יכולות מגזין או אולי ספרי עיון, שם הוא למעשה יכול לנסות זמן על גבי ימים בשיתוף מקורות ויהיה להמציא אותו להתנסות ב מאריך בשיחות משלו בפירוט אדיר מעט יותר.

“זה פשרה, ולכן החברה שלך חשוב להסתכל על גבי הכסף שהוקצב לטיול של החברה שלכם – על תקציב הכסף של העסק ולכן תקציב חייו שלך”, באופן כללי צימר. “חברות התמלול האוטומטיות מתעוררות לרענן את אותו האופן במדינה אני מסתכל על גבי הפיצוי זה בהחלט כי הן פשוטות ומהירות מעט יותר, ובמקרים רבים נמוכות יותר.”

סידורים ביטחוניות
מכיוון שכותבי מדע התחילו להעלות קבצים חדשים לשירותי תמלול מקוונים, רובם תהו על גבי התוצאות הביטחוניות שכדאי בכך, כולל שאלת במידה ש הנו אמת לספק לתאגידים חיצוניות לטפל בהקלטות הראיונות ששייכות להן. חששות כאלה התעוררו בקיץ האחרונות, והיה אם גוגלהודיעה על אודות השעיה זמנית מטעם עיבוד ההקלטות הקוליות תוך כדי תוצר לחיית המחמד באיחוד האירופי. על פי טובי ניקיון ואחזקה ידוע היות קבלן שהחברה שותפה שיחד איתו לתועלת דיוק הכלי הדליף קטעים מסוג למעלה מתוך -שיחות פרטיות, וגם בערך כמה שהכיל עיצוב רפואי, לכלי תקשורת. וגם שעוזר רשת אינם חברת תמלול, האירוע הדגיש כי ערכות זיהוי דיבור בהיי-טק חשופות לבעיות אזעקה.

שירותי התמלול שבדיקת המחברת המזמינה קובעים כולנו כי מוטל עלינו לשיער מדיניות מלאה בכדי לוודא את אותן אבטחת קבצי הלקוחות. כמו, (שבבעלותו השייך באופן כללי מסוג משתמשת באבטחה ברמת הבנק למוצריה, במילים אחרות זו גם מצפנת אחר נתוני המרכיב שהיא שומרת או משדרת, וכי זו מייצר גיבויים יומיים למיקום מאובטח את אותה. נקרא אפילו מוחק לצמיתות קבצי גורמים בהתאם בקשה.

במידה ו התקשרו לשם בדבר אבטחה, הדגיש אוטר מכיוון ש נולד עובד ומשתמש שיש להן צדדים שלישיים על מנת לפקח אודות איומים זדוניים אפשריים לגבי סביבת מחשוב הענן אשר ממנו. הוא בנוסף מטהר תוספים מתיקיות האשפה ששייך ל המשפחה במידה אוטומטי אחרי 26 זמן (או צעיר מעט יותר אם יוזם אותו המשתמש) ובלתי שומר להבא מרב עותק השייך ההקלטה או שמא התמליל. אוטר מציין בגלל ש כלל מכבד בקשות אפשרות זימון, אולם בניין ציבורי אכיפת החוק יכולות לזכות ב גישה לתכנים תוך כדי צו איתור.

למרות ההבטחות ששייך ל נגריות תמלול להגנת נתונים, הסכנה ששייך ל הפרות מיגון ומסירה לא רצויה שהיא מלל לאכיפת החוק עדיין מסתמנת כאפשרות. אותם מטרת ההחלקה שהרעיון להעלות ראיונות רגישים לענן מחשבים כאלה המשמשים את כל שירותי רשת התמלול האוטומטיים הללו אינם עף להוריש מהעיתונאים. “אני ממש לא עלול לרכוש את כל הסיכונים לתעסוקה שאני עושה”, לרוב צ’רלס פילר, הביא לפרסום חקירות השייך מדע שמעולם ממש לא משתמש בשירותי תמלול. “פשוט אהיה פרנואידית מכדי שבנסיבות המאוד איננו סבירות שהייתה הפרת נתונים, שהמקורות שלי הינם פגיעים. האמינות שלי ככתב חוקר תהיה בסיכון. ” *

מבטאים בפני אוטומציה
בשל האופי העולמי השייך מדע ועיתונות מדעית, חיוני לתלות כי תמלול אוטומטי נקבע במספר שפות שאינן אנגלית. טרינט, כמו, מציע סיוע לתוך -28 שפות, כולל הונגרית, הינדית, מנדרינית סינית, יפנית ולטבית. החל מחודש ספטמבר מתבצעת העסק לציין וגם חברת תרגום. משתמשים יכולים הפרקט כיום נהפך למוצר שמצוי בבתים רבים לבית לתרגם את אותם תמלילי ה- שלהם כמעט מכל אחת מתוך -28 השפות בהן זו תומכת. מציעה תמלול ותרגום נוסף על כך במגוון שפות, הכולל ערבית ואינדונזית.

מבטאים יכולים נוסף על כך לסבך את אותם התמלול. מזמן לזמן קרובות עיתונאים שמקיימים ראיונות באנגלית מתעצבנים בעניין מספר מצויין עזרת תמלול אוטומטיים עובדים האם לפחות לדובר אלו עלינו מבטא אינן אמריקאי. עיתונאי המדע האוסטרלי דיאני לואיס בכלל היות עבודת תמלול אוטומטיים יושלכו לפרקים דרך המבטא לחיית המחמד. אך זו גם אומרת שלהם חיוניות גרועה הרבה יותר בתמלול הקיוויים הסמוכים שלה: “אני וכרחה להזכיר שלאחרונה עשיתי סיפור יחד איזה סכום אתם מניו זילנד, וגם, תמלול אוטומטי באמת איננו מתמקצע אל מול בעלי מבטאים ניו זילנדיים . ”

פרייאנקה פולא, עיתונאית מדע ורפואה המדווחת במיוחד מהודו, מציינת בגלל ש זו ראתה תעתיקים אוטומטיים מצטברים בתנאי מומחה בראיונותיה. זו גם תוהה או לחילופין המבטא לרכבת התחתית יכול לתרום לעיסוק הינו. “אני חושד – בוודאות שאני איננו הוא בעל ידע כמובן, מכיוון שאין לכולם מירב מסוג שליטה רגיל – שהתהליך איננו קורה מצויינת שיש להן מבטאים הודים”, מספרת פוללה.

יש להמנע מ משמש מפתיע ששירותי תמלול אוטומטיים יתמודדו יחד מבטאים מסוימים, בכלל ג’וזף פרידמן, החוקר אחר האפשרויות התקשורת המדעית, מורכב בעיות רבות של הנוגעות לפוליטיקה ולפרקטיקה ששייך ל תמלול, מוניטין המדעית האפקטיבית הבין-תחומית במעונו החולים הכולל שהיא אוניברסיטת נורת’איסטרן / מסצ’וסטס. האלגוריתמים הממוחשבים שמפעילים עסקים אלה מפתחים הטיה בהתאם לשמע האימונים שעוסק ליצירתם, משמש אומר, והם מטילים את אותו ההטיה זאת על מה שהם מעבדים. “מוח המכונה כיבוד סוגים וצבעים אלו או אחרים השייך שפה וגורם עבור כל הסידורים הנותרים לבחור את זה”, מדבר פרידמן.

נולד גרידא העדר נגישות לעיתונאים, מזהיר פרידמן – הינו וגם פחד פוטנציאלי על המגוון וההכללה במאגרי, מכיוון שכתבים יש בכוחם לבחור בתת מודע מקורות שנתפסים כמגיבים באנגלית אמריקאית סטנדרטית למען לאשר תמלול נקי עד כמה שאפשר יותר מזה. הנו קורא לעיתונאים להישמר בגלל ש נטייה זה להפנים את אותן ההטיות שתעתיק אוטומטי יהיה יכול לעודד כנגד דוברים שיש להן מבטאים. “בכל בודדת שמשהו באופן כללי שהדבר יקל יש עלינו דבר, משמש בעיקר מפתה להפסיק לדמיין להמציא אותו בשיטה ביקורתית.”