نحوه استفاده از عملکرد Google Sheets ImportXML برای جمع آوری داده ها در همه جا

Video نحوه استفاده از عملکرد Google Sheets ImportXML برای جمع آوری داده ها در همه جا

می توانید داده ها را از هر صفحه وب با استفاده از عملکرد ImportXML برگه های Google وارد کنید. در اینجا نحوه استفاده از عملکرد ImportXML در Google Sheets آورده شده است.

با تسلط بر عملکرد ImportXML Google Sheet ، احساس می کنید که قبلاً دارای یک جادوگر ورق معتبر هستید. ImportXML اطلاعاتی را از هر زمینه XML بدست می آورد. با تشکر از آن ، می توانید داده ها و ابرداده های ایجاد شده روی آن را در هر نقطه بارگیری کنید.

مبانی XML و HTML

زبان نشانه گذاری XML مجموعه داده ها را در یک صفحه وب مشخص می کند. در اصل ، هر مجموعه ای از <something> و </something> - بلوک های ساخت منبع کد وب یا مجموعه خاصی از داده ها در داخل آنها ساکن خواهند شد. کد منبع وب متن خاصی در برچسب aragraph <p> - پاراگراف ، که گاه حاوی <b> قدیمی - با متن پررنگ و احتمالاً <a> یک لینک - لینک (در زیر </ a > </b>. </p> </body> برای بستن کل برچسب).

عملکرد Google Sheets ImportXML می تواند مجموعه ای از داده های XML خاص را پیدا کند و داده های خارج از آن را کپی کند. در مثال بالا ، اگر می خواهیم همه پیوندها را در صفحه بدست آوریم ، باید از عملکرد ImportXML بخواهیم تا تمام اطلاعات را در برچسب <a> </a> وارد کند . اگر می خواهید کل متن وب ، با استفاده از همه چیز در <body> </body> یا هر نسخه از <p> </p> شروع کنید ، سپس داده ها را در مراحل بعدی حذف کنید.

نحوه استخراج لیستی از کدپستی و شهرستان در شهر

جداول ویکی پدیا تمرین های ImportXML عالی است. در این مقاله نمونه بارگیری کل کدپستی در ادمونتون ، آلبرتا را خواهید گرفت. لیستی از کدپستی های کانادایی را با شروع نامه T پیدا کنید. برای شروع ، آن صفحه را در یک پنجره مرورگر جدید باز کنید.

نحوه استفاده از عملکرد Google Sheets ImportXML برای جمع آوری داده ها در همه جا

کد پستی را انتخاب کنید ، بر روی آن راست کلیک کنید و برای باز کردن منبع مرورگر گزینه بازرسی را انتخاب کنید تا منبع صفحه را مشاهده کنید. خواهید دید که کد منبع منبع در یک برچسب قرار دارد (یک سلول در جدول را مشخص کنید). پس از آن ، این مقاله تمام برچسب های TD موجود از ادمونتون را در آنها وارد می کند.

یک برگه خالی Google جدید ایجاد کنید. در این مقاله کلیه محتوای برچسب TD از جمله <span> گرفته شده و با مشخص کردن داده هایی که می خواهید از نحو XPath استفاده کنید پیوند می یابد. ImportXML URL و برچسب مورد نظر را به عنوان یک استدلال برای ورود به صفحات Google دریافت می کند.

= importxml ("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada" ، "// td")

نتیجه زیر را می گیرید:

نحوه استفاده از عملکرد Google Sheets ImportXML برای جمع آوری داده ها در همه جا

با مراجعه به منبع صفحه ، کد پستی را به صورت پررنگ در برچسب <b> </ b> ، نام شهری که به مقاله های ویکی پدیا در زیر <a> </a> پیوند دارد ، خواهیم دید. اکنون سعی کنید فقط در هر جعبه بزرگ شهر پیوند بگیرید و سایر پیوندها (محلات) را حذف کنید. آنها را در دو فرمان اصلی ستون A و B ویرایش کنید:

= importxml ("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada" ، "// td / span / a [1]")

= importxml ("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada" ، "// td / b [1]")

شما باید نتایج را کمی اصلاح کنید:

نحوه استفاده از عملکرد Google Sheets ImportXML برای جمع آوری داده ها در همه جا

این عمل به شما کمک می کند تا نحو عملکرد نحوی query XPath را دریابید: یک برچسب فقط نسخه اول <tag> را در <برچسب اصلی> ارائه می دهد. بنابراین ، td / span / a [1] اولین لینک در <span> را در هر <td> به شما می دهد. به طور مشابه ، td / b [1] اولین متن جسورانه را در هر <td> یا فقط کد پستی در این مورد به شما می دهد.

نکته مهم این است که می توانید دو پرس و جو را در یک عملکرد اجرا کنید. بنابراین ، مقاله دو درخواست را با نماد | ترکیب می کند در وسط:

= importxml ("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada" ، "// td / span / a [1] | // td / b [1]")

با این حال ، شما همان نتایج قبلی را نمی گیرید. این گزینه به جای دو ستون ، کل درخواست را به یک لیست بلند متناوب می دهد. فواید زیادی دارد اما در این مقاله ضروری نیست.

نحوه استفاده از عملکرد Google Sheets ImportXML برای جمع آوری داده ها در همه جا

برای انتخاب کد پستی در جعبه های حاوی پیوند 'ادمونتون'. ما از این کد استفاده خواهیم کرد:

= importxml ("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada" ، "// td [span / a = 'Edmonton'] / b [1]")

"جستجو" - متن واجد شرایط را برای محدود کردن نتایج در براکت های مربع بدون تأثیر در رسیدن به نتایج بدست آورید.

نحوه استفاده از عملکرد Google Sheets ImportXML برای جمع آوری داده ها در همه جا

اکنون به نام مناطق اطراف. تابع importXML مناسب را در ستون بعدی بنویسید و متن زیر را از "ادمونتون" دریافت کنید.

مقاله کل مطالب مربوط به دهانه [1] را در بر می گیرد و از پرانتز و پارچه ای برای تقسیم محتوا استفاده می کند ، "ادمونتون" را در ستون اول و نام محله را در ستون زیر قرار می دهد. می توانیم کد پستی را با نام مربوطه ترکیب کنیم:

= importxml ("https://en.wikipedia.org/wiki/List_of_T_postal_codes_of_Canada" ، "// td [span / a = 'Edmonton'] / span [1]")

در مرحله بعد ، از تابع Split استفاده کنید و برخی از ستون های زیر را برای تقسیم و گروه بندی داده های پردازش شده ، به هم پیوند دهید:

= SPLIT (پیوستن (B2: J2) ، "(/)")

سرانجام ، در اینجا جدول نتایج با اطلاعات لازم آورده شده است:

نحوه استفاده از عملکرد Google Sheets ImportXML برای جمع آوری داده ها در همه جا

نحوه کپی کردن آدرس های ایمیل به صورت خودکار از وب

نحوه استفاده از عملکرد Google Sheets ImportXML برای جمع آوری داده ها در همه جا

مقاله نحوه دریافت ایمیل همه کارمندان را در صفحه About | راهنمایی می کند زاپیر با نگاهی به کد منبع ، خواهید دید که آدرس ایمیل هر یک از اعضا در قسمت class = "email" قرار دارد. وقتی می خواهید یک ویژگی برچسب را مشخص کنید ، از عملکرد Google Sheets ImportXML به شرح زیر استفاده کنید:

= importxml ("https://zapier.com/about//" ، "// span [@ class = 'email']")

نحوه استفاده از Regex برای وارد کردن آدرس های ایمیل از وب در Google Sheets.

برای به دست آوردن آدرسهای Zapier با استفاده از "قدرت" Regex ، به جای جستجوی کلاس ، دستور <span> را وارد می کنیم. اکنون این کار را در دو مرحله انجام خواهیم داد: اطلاعات را از صفحه Zapier به ستون اول فراخوانی کنید ، سپس ایمیل را در ستون دوم مرتب کنید:

= importxml ("https://zapier.com/about//" ، "// span")

= regexextract (A1، "[a-zA-Z0-9 _ \. \ + -]] + @ [a-zA-Z0-9 - \.] + \. [a-zA-Z0-9 -] {2، 15} ")

سرانجام این جدول را خواهیم داشت:

نحوه استفاده از عملکرد Google Sheets ImportXML برای جمع آوری داده ها در همه جا

به یاد داشته باشید ، ImportXML بسته به داده هایی که پیدا می کند ، تمام ستون ها و ردیف ها را به خودی خود پر می کند. جستجوی regex باید در هر سلولی که می خواهید نتیجه بگیرید ، پر شود. برای جمع کردن همه این موارد ، فقط باید از دستور Regexextract استفاده کنید ، که یک فرمول ثابت آرایه است:

= ArrayFormula (IFERROR (REGEXEXTRACT (IMPORTXML ("https://zapier.com/about//"، "// span")) ، "[a-zA-Z0-9 _ \. \ + -] + @ [a- zA-Z0-9 - \.] + \. [a-zA-Z0-9 -]، 2،15} "))))

و نتیجه این است:

نحوه استفاده از عملکرد Google Sheets ImportXML برای جمع آوری داده ها در همه جا

امیدوارم مقاله برای شما مفید باشد!

نحوه حذف یک صفحه در Google Docs

نحوه حذف یک صفحه در Google Docs

چگونه یک صفحه را در Google Docs حذف کنیم ، چگونه یک صفحه سفید را در Google Docs حذف کنیم؟ بسیار ساده. در اینجا برخی از سریعترین روشهای حذف صفحات در Google Docs آورده شده است.

نحوه ایجاد بروشور از الگوها در Microsoft Word

نحوه ایجاد بروشور از الگوها در Microsoft Word

نحوه تهیه بروشور از الگوها در Microsoft Word ، یکی از مزایای Word این است که الگوهای آنلاین آن به شما امکان می دهد اسناد حرفه ای ایجاد کنید.

دستورالعمل های تبدیل PDF به تصویر بدون نرم افزار

دستورالعمل های تبدیل PDF به تصویر بدون نرم افزار

دستورالعمل های تبدیل PDF به تصاویر بدون نرم افزار ، دستورالعمل های تبدیل فایل های PDF به JPG ، PNG ... بدون استفاده از نرم افزار با مراحل بسیار ساده.

نحوه ایجاد شجره نامه در Microsoft PowerPoint

نحوه ایجاد شجره نامه در Microsoft PowerPoint

نحوه ایجاد یک درخت خانوادگی در Microsoft PowerPoint ، شما می توانید با استفاده از یکی از چندین سبک گرافیکی SmartArt درخت خانوادگی خود را در PowerPoint ایجاد کنید

با Edraw Mind Map نقشه های حرفه ای ذهن ایجاد کنید

با Edraw Mind Map نقشه های حرفه ای ذهن ایجاد کنید

با Edraw Mind Map ، دستورالعمل نصب و استفاده از نرم افزار ساخت Edraw Mind Map بسیار حرفه ای و ساده ، یک نقشه ذهنی حرفه ای بسازید.

دفترچه راهنمای کاربر ABBYY FineReader

دفترچه راهنمای کاربر ABBYY FineReader

راهنمای کاربر ABBYY FineReader ، ABBYY FineReader یک نرم افزار حرفه ای برای شناسایی شخصیت های نوری (OCR) است. در این مقاله دستورالعمل هایی برای استفاده از ABBYY FineReader ارائه می شود

پاورپوینت را بیاموزید - درس 5: نحوه استفاده از تم ها برای اسلایدهای اسلایدهای پاورپوینت

پاورپوینت را بیاموزید - درس 5: نحوه استفاده از تم ها برای اسلایدهای اسلایدهای پاورپوینت

پاورپوینت را بیاموزید - درس 5: نحوه استفاده از تم برای اسلایدهای پاورپوینت ، قالب پاورپوینت ترکیبی از رنگ ها ، قلم ها و جلوه های از پیش تعریف شده است. بیایید به WebTech360 بپیوندیم

نحوه ضبط و ضبط ارائه های پاورپوینت

نحوه ضبط و ضبط ارائه های پاورپوینت

نحوه ضبط ، ضبط ضبط پاورپوینت ، با پاورپوینت می توانید ارائه ها را به طور کامل ضبط و ضبط کنید و سپس آنها را برای استفاده در دستگاه های دیگر ذخیره کنید.

پاورپوینت را بیاموزید - درس 11: نحوه ایجاد لیست در Microsoft PowerPoint

پاورپوینت را بیاموزید - درس 11: نحوه ایجاد لیست در Microsoft PowerPoint

پاورپوینت را بیاموزید - درس 11: نحوه ایجاد لیست در پاورپوینت مایکروسافت ، قالب بندی محتوای پاورپوینت به صورت لیست گلوله دار یا شماره دار به راحتی به مخاطب کمک می کند

پاورپوینت را بیاموزید - درس 26: ویرایش مضامین در Microsoft PowerPoint

پاورپوینت را بیاموزید - درس 26: ویرایش مضامین در Microsoft PowerPoint

پاورپوینت را بیاموزید - درس 26: ویرایش موضوع در Microsoft PowerPoint ، Microsoft PowerPoint به شما امکان می دهد قلم را به دلخواه تغییر دهید. اگر نمی دانید چه کاری باید انجام دهید ،

دستورالعمل ترجمه اسناد PDF چندزبانه بدون نرم افزار

دستورالعمل ترجمه اسناد PDF چندزبانه بدون نرم افزار

دستورالعمل ترجمه اسناد PDF چند زبانه بدون نرم افزار ، دستورالعمل ترجمه اسناد PDF چند زبانه به ویتنامی بدون استفاده از نرم افزار.

نحوه صرفه جویی در باتری برای ماوس بی سیم

نحوه صرفه جویی در باتری برای ماوس بی سیم

نحوه صرفه جویی در مصرف باتری برای ماوس بی سیم ، در حال حاضر روند استفاده از موش های بی سیم بیشتر و بیشتر شده است ، بنابراین نکات مربوط به صرفه جویی در مصرف باتری به شما کمک زیادی می کند.

چگونه صفحات چاپ شده دو طرفه را به طور متقارن در Word تراز کنیم

چگونه صفحات چاپ شده دو طرفه را به طور متقارن در Word تراز کنیم

چگونه صفحات چاپ شده دو طرفه را به طور متقارن در Word تراز کنیم ، برای اسناد طولانی ، اگر می خواهید از هر دو طرف چاپ کنید و سپس ستون فقرات را برای راحتی کار به یک حجم متصل کنید ، باید قبل از چاپ حاشیه ها را تراز کنید.

نحوه فشرده سازی فایل های PDF ، کاهش اندازه PDF بدون نصب نرم افزار

نحوه فشرده سازی فایل های PDF ، کاهش اندازه PDF بدون نصب نرم افزار

نحوه فشرده سازی فایل های PDF ، کاهش اندازه PDF بدون نصب نرم افزار ، دستورالعمل های فشرده سازی فایل ها ، کاهش اندازه فایل PDF با یک ابزار بسیار ساده و سریع آنلاین

پاورپوینت را بیاموزید - درس 22: دستورالعمل استفاده از گرافیک SmartArt

پاورپوینت را بیاموزید - درس 22: دستورالعمل استفاده از گرافیک SmartArt

پاورپوینت را بیاموزید - درس 22: راهنمای استفاده از گرافیک SmartArt ، پاورپوینت سبک های مختلفی را برای نشان دادن ایده های مورد نظر خود به شما ارائه می دهد. در اینجا نحوه

پاورپوینت را بیاموزید - درس 25: فایلهای ارائه را در Microsoft PowerPoint بررسی و محافظت کنید

پاورپوینت را بیاموزید - درس 25: فایلهای ارائه را در Microsoft PowerPoint بررسی و محافظت کنید

پاورپوینت را بیاموزید - درس 25: فایلهای ارائه را در Microsoft PowerPoint بررسی و محافظت کنید ، پاورپوینت به شما امکان می دهد تا ارائه ها را بررسی و محافظت کنید. اینجاست

پاورپوینت را بیاموزید - درس 28: نحوه درج پیوندها در Microsoft PowerPoint

پاورپوینت را بیاموزید - درس 28: نحوه درج پیوندها در Microsoft PowerPoint

پاورپوینت را بیاموزید - درس 28: نحوه درج پیوندها در پاورپوینت مایکروسافت ، می توانید پیوندها را به راحتی در پاورپوینت وارد کنید. در اینجا دستورالعمل هایی برای درج پیوندها در پاورپوینت آورده شده است.

نحوه برجسته سازی متن در فایل های PDF در 5 مرحله آسان

نحوه برجسته سازی متن در فایل های PDF در 5 مرحله آسان

نحوه برجسته سازی متن در فایل PDF در 5 مرحله آسان ، نحوه برجسته سازی در PDF کار چندان دشواری نیست. بیایید با WebTech360 بیاموزیم که چگونه PDF را به راحتی برجسته کنیم

دستورالعمل نحوه تقسیم ستون ها در Microsoft Word

دستورالعمل نحوه تقسیم ستون ها در Microsoft Word

دستورالعمل نحوه تقسیم ستون ها در Microsoft Word ، چگونه می توان ستون ها را در Word 2016 مجموعه Office 2016 Office تقسیم کرد؟ اگر نمی دانید ، بیایید با WebTech360 برویم

دستورالعمل ثبت نام و ورود به سیستم CareerBuilder

دستورالعمل ثبت نام و ورود به سیستم CareerBuilder

CareerBuilder برای ثبت نام و راهنمای ورود به سایت CareerBuilder ، یک وب سایت جستجوی کار دو طرفه برای کارفرمایان و داوطلبان است. در مقاله زیر ، WebTech360