จากที่เรานั้นไดศึกษา จากบทความเกี่ยวกับการใช้งาน โมดูล {--mlinkarticle=5546--}Selenium (ซิลิเนี่ยม){--mlinkarticle--} กันมาบ้างแล้ว เช่น บทความ {--mlinkarticle=6371--}วิธีการสุ่มเปิดลิงค์ที่ได้มาจากการเสริชในกูเกิ้ลโดยใช้โมดูล selenium (ซิลิเนียม){--mlinkarticle--} , {--mlinkarticle=6370--}วิธีการเข้าไปดูเนื้อหาของไตเติ้ลที่เราได้มาจากการเสริชในกูเกิ้ลโดยใช้โมดู selenium (ซิลิเนียม){--mlinkarticle--} หรือจะเป้นบทความ {--mlinkarticle=6280--}การหา X path (เอกซ์พาท) ง่ายๆเพื่อนำไปใช้กับโมดูล Selenium (ซิลิเนี่ยม){--mlinkarticle--} ในบทความนี้เราจะมาแนะนำการปประยุกต์ใช้โมดูลนี้กับภาษาไพธอนกัน
การตัดคำที่ดึงออกมาจากโครงสร้างเว็บ โดยใช้โมดูลซิลิเนียม ในภาษาไพธอน
โดยปกติแล้วเราสามารถดึงคำออกมาจากโครงสร้างหน้าเว็บได้ได้อยู่แล้วโดยใช้เมธอดหรือคำสั่งต่างๆในการดึงข้อความออกมาใช้งานแต่ในบางครั้งคำที่เราดึงออกมาอาจจะเป็นคำที่เราต้องการเพียงแค่บางคำ ดังนั้นเราจึงต้องใช้ตัวช่วยอื่นหลังจากดึงคำทั้งหมดออกมาแล้วเช่น ฟังก์ชั่นบิ๊วอินต่างๆหรือโมดูลอื่นๆ ในบทความนี้จะใช้ฟังก์ชัน built in ที่ชื่อว่า split() ซึ่งจะแบ่งคำตามช่องว่าง
การตัดคำที่ดึงออกมาจากโครงสร้างเว็บ โดยใช้โมดูลซิลิเนียม ในภาษาไพธอน ด้วยฟัง์ชั่นบิ๊วอิน split()
1.เปิดหน้าเว็บและโครงสร้างหน้าเว็บที่เราต้องการเเก็บไตเติ้ลหรือข้อความเอามาตัด
2.พิมพ์โค้ดดังนี้
# -*- coding: utf-8 -*-
from selenium import webdriver
import time,random #อิมพอร์ตโมดูล
driver = webdriver.Firefox(executable_path=r'C:\Users\BDC-CLUB\PycharmProjects\mdsoft\geckodriver.exe')
driver.get('https://www.google.com/') #เปิดหน้าเว้บที่ต้องการเก็บลิงค์และไตเติ้ล
a = driver.find_element_by_class_name("gsfi") #เข้าถึลงลิงค์และไตเติ้ลโดย XPath
a.send_keys("hello python") #เสริชคำว่า "hello python"
a.submit()
time.sleep(3)
#xpath_topic= "//a[@class='topictitle']" #x path ของไตเติ้ล
xpath_topic= "//div//h3//a[@href]"
all_ids_topic = driver.find_elements_by_xpath(xpath_topic) #เก็บ sessionและelementไว้ในตัวแปร
a = all_ids_topic[0].text #เก็บข้อความของไตเติ้ลในตำแหน่ง0 ไว้ในตัวแปร a
print("ยังไม่ตัดคำ",a)
a = a.split()
print("ตัดคำแล้ว",a)
ผลการรัน
ยังไม่ตัอคำ Hello, World! - Learn Python - Free Interactive Python Tutorial
ตัดคำแล้ว ['Hello,', 'World!', '-', 'Learn', 'Python', '-', 'Free', 'Interactive', 'Python', 'Tutorial']