最近在学 linux shell 一直学不会 sed 与 grep 的用法,希望大佬指点一下
打算用来提取 html 里面的内容,测试代码如下
<tr border=0>
<tr><td valign=top>
<div id="leftside">
<div class="clear">
</div>
<div id="playvideo">
<div id="playvideo-videoname">
韩式 Sussi
</div>
<div id="playvideo-content">
<div class="arrow-general">
</div>
<div class="videoplayer">
<video id="vid" class="video-js vjs-default-skin vjs-big-play-centered"
controls preload="auto" width="465" height="360"
poster="http://img2.aliyun.com/thumb/FA13AS3456XVB.jpg" >
<source src="http://v.advideos.com//mp43/FA13AS3456XVB.mp4?st=boGNNUn6--7TxTJJ8uKtjA&e=1518240294" type='video/mp4'>
</div>
</div>
</div>
</div>
</div>
</tr>
</table>
1、想要提取
<div id="playvideo-videoname">
韩式 Sussi
</div>
里面的 韩式 Sussi
2、和
<source src="http://v.advideos.com//mp43/FA13AS3456XVB.mp4?st=boGNNUn6--7TxTJJ8uKtjA&e=1518240294" type='video/mp4'>
里面的 http://v.advideos.com//mp43/FA13AS3456XVB.mp4?st=boGNNUn6--7TxTJJ8uKtjA&e=1518240294 url ,当面页面里面可能有好几个
听说 sed 只能按行来提,这样的话第一个要提取的内容老是提不出来。第二个因为是在 src 里面而且通配另一个字串,原谅我正则表达 式真的看不懂。
请大佬们解惑。