Quantcast
Channel: สอน PHP สอนทำเว็บด้วย Joomla ระบบ CRM บทความ Hosting - สอน PHP สอนทำเว็บด้วย Joomla ระบบ CRM บทความ Hosting
Viewing all articles
Browse latest Browse all 16

การตัดคำที่ดึงออกมาจากโครงสร้างเว็บ โดยใช้โมดูลซิลิเนียม ในภาษาไพธอน

$
0
0

 

                      จากที่เรานั้นไดศึกษา จากบทความเกี่ยวกับการใช้งาน โมดูล {--mlinkarticle=5546--}Selenium (ซิลิเนี่ยม){--mlinkarticle--} กันมาบ้างแล้ว เช่น บทความ {--mlinkarticle=6371--}วิธีการสุ่มเปิดลิงค์ที่ได้มาจากการเสริชในกูเกิ้ลโดยใช้โมดูล selenium (ซิลิเนียม){--mlinkarticle--}  , {--mlinkarticle=6370--}วิธีการเข้าไปดูเนื้อหาของไตเติ้ลที่เราได้มาจากการเสริชในกูเกิ้ลโดยใช้โมดู selenium (ซิลิเนียม){--mlinkarticle--} หรือจะเป้นบทความ {--mlinkarticle=6280--}การหา X path (เอกซ์พาท) ง่ายๆเพื่อนำไปใช้กับโมดูล Selenium (ซิลิเนี่ยม){--mlinkarticle--}  ในบทความนี้เราจะมาแนะนำการปประยุกต์ใช้โมดูลนี้กับภาษาไพธอนกัน

 

การตัดคำที่ดึงออกมาจากโครงสร้างเว็บ โดยใช้โมดูลซิลิเนียม ในภาษาไพธอน 

                    โดยปกติแล้วเราสามารถดึงคำออกมาจากโครงสร้างหน้าเว็บได้ได้อยู่แล้วโดยใช้เมธอดหรือคำสั่งต่างๆในการดึงข้อความออกมาใช้งานแต่ในบางครั้งคำที่เราดึงออกมาอาจจะเป็นคำที่เราต้องการเพียงแค่บางคำ ดังนั้นเราจึงต้องใช้ตัวช่วยอื่นหลังจากดึงคำทั้งหมดออกมาแล้วเช่น ฟังก์ชั่นบิ๊วอินต่างๆหรือโมดูลอื่นๆ ในบทความนี้จะใช้ฟังก์ชัน built in ที่ชื่อว่า split()  ซึ่งจะแบ่งคำตามช่องว่าง

 

การตัดคำที่ดึงออกมาจากโครงสร้างเว็บ โดยใช้โมดูลซิลิเนียม ในภาษาไพธอน  ด้วยฟัง์ชั่นบิ๊วอิน split()

                    1.เปิดหน้าเว็บและโครงสร้างหน้าเว็บที่เราต้องการเเก็บไตเติ้ลหรือข้อความเอามาตัด

                     

                    2.พิมพ์โค้ดดังนี้

# -*- coding: utf-8 -*-
from selenium import webdriver
import time,random #อิมพอร์ตโมดูล
driver = webdriver.Firefox(executable_path=r'C:\Users\BDC-CLUB\PycharmProjects\mdsoft\geckodriver.exe')
driver.get('https://www.google.com/') #เปิดหน้าเว้บที่ต้องการเก็บลิงค์และไตเติ้ล
a = driver.find_element_by_class_name("gsfi") #เข้าถึลงลิงค์และไตเติ้ลโดย XPath
a.send_keys("hello python")  #เสริชคำว่า "hello python"
a.submit()
time.sleep(3)
#xpath_topic= "//a[@class='topictitle']" #x path ของไตเติ้ล
xpath_topic= "//div//h3//a[@href]"
all_ids_topic = driver.find_elements_by_xpath(xpath_topic) #เก็บ sessionและelementไว้ในตัวแปร
a = all_ids_topic[0].text #เก็บข้อความของไตเติ้ลในตำแหน่ง0 ไว้ในตัวแปร a
print("ยังไม่ตัดคำ",a)
a = a.split()
print("ตัดคำแล้ว",a)

 

                  ผลการรัน

ยังไม่ตัอคำ Hello, World! - Learn Python - Free Interactive Python Tutorial
ตัดคำแล้ว ['Hello,', 'World!', '-', 'Learn', 'Python', '-', 'Free', 'Interactive', 'Python', 'Tutorial']

 

 


Viewing all articles
Browse latest Browse all 16

Latest Images

Trending Articles


หารายได้เสริม รับงานฝีมือมาทําที่บ้าน งานประกอบดอกไม้ อาชีพเสริมเพิ่มรายได้


หารายได้พิเศษทําที่บ้าน ช่วงเย็น หลังเลิกเรียน หลังเลิกงาน


Swott.คือ


การ SUM ข้าม Sheet Microsoft Excel


อาชีพเสริมปักแผ่นเฟรม งานฝีมือทําที่บ้าน หารายได้พิเศษ ทำได้ทุกจังหวัด


ติดตั้ง YouTube++ แบบไม่ต้องเจลเบรค รองรับ iOS 10.2


วิธีแก้ปัญหาเมื่อเปิดคอมฯ แล้วขึ้นหน้าต่าง Desktop.ini LocalizedResourceName


จางเหมี่ยวอี๋ นางเอกจีนสายแบ๊วที่มาแรงกับซีรี่ย์จีน 4 เรื่องติด!


ใส่สีตารางสลับแถว เว้นแถว Excel 2016 | 2013


แจก Brush ฟรี!! สไตล์วาดการ์ตูนมังงะสำหรับใช้ในแอป Procreate





Latest Images