国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術(shù)文章
文章詳情頁

Java程序去調(diào)用并執(zhí)行shell腳本及問題總結(jié)(推薦)

瀏覽:39日期:2022-08-31 09:25:42

摘要: 該文章來自阿里巴巴技術(shù)協(xié)會(huì)(ATA)精選集 背景 我們在開發(fā)過程中,大部分是java開發(fā), 而在文本處理過程中,主要就是腳本進(jìn)行開發(fā)。 java開發(fā)的特點(diǎn)就是我們可以很早地進(jìn)行TDDL, METAQ 等等地對接; 而腳本開發(fā)的特點(diǎn)就是在進(jìn)行批處理的時(shí)候非常方便。

背景

我們在開發(fā)過程中,大部分是java開發(fā), 而在文本處理過程中,主要就是腳本進(jìn)行開發(fā)。 java開發(fā)的特點(diǎn)就是我們可以很早地進(jìn)行TDDL, METAQ 等等地對接; 而腳本開發(fā)的特點(diǎn)就是在進(jìn)行批處理的時(shí)候非常方便。 前陣子我遇到這么一個(gè)需求場景: 對抓取的數(shù)據(jù)進(jìn)行打包, 后來又遇到我要通過腳本進(jìn)行抓取,比如nodejs下基于phantomjs的casperjs爬蟲。

解決方法

對于第一個(gè)問題:java抓取,并且把結(jié)果打包。 那么比較直接的做法就是,java接收各種消息(db,metaq等等),然后借助于jstorm集群進(jìn)行調(diào)度和抓取。 最后把抓取的結(jié)果保存到一個(gè)文件中,并且通過調(diào)用shell打包, 回傳。 也許有同學(xué)會(huì)問, 為什么不直接把java調(diào)用odps直接保存文件,答案是,我們的集群不是hz集群,直接上傳odps速度很有問題,因此先打包比較合適。(這里不糾結(jié)設(shè)計(jì)了,我們回到正題)

java調(diào)用shell的方法

通過ProcessBuilder進(jìn)行調(diào)度

這種方法比較直觀,而且參數(shù)的設(shè)置也比較方便, 比如我在實(shí)踐中的代碼(我隱藏了部分業(yè)務(wù)代碼):

ProcessBuilder pb = new ProcessBuilder('./' + RUNNING_SHELL_FILE, param1, param2, param3); pb.directory(new File(SHELL_FILE_DIR)); int runningStatus = 0; String s = null; try { Process p = pb.start(); try { runningStatus = p.waitFor(); } catch (InterruptedException e) { } } catch (IOException e) { } if (runningStatus != 0) { } return;

這里有必要解釋一下幾個(gè)參數(shù):

RUNNING_SHELL_FILE:要運(yùn)行的腳本SHELL_FILE_DIR:要運(yùn)行的腳本所在的目錄; 當(dāng)然你也可以把要運(yùn)行的腳本寫成全路徑。runningStatus:運(yùn)行狀態(tài),0標(biāo)識(shí)正常。 詳細(xì)可以看java文檔。param1, param2, param3:可以在RUNNING_SHELL_FILE腳本中直接通過1,2,$3分別拿到的參數(shù)。

直接通過系統(tǒng)Runtime執(zhí)行shell

這個(gè)方法比較暴力,也比較常用, 代碼如下:

p = Runtime.getRuntime().exec(SHELL_FILE_DIR + RUNNING_SHELL_FILE + ' '+param1+' '+param2+' '+param3);p.waitFor();

我們發(fā)現(xiàn),通過Runtime的方式并沒有builder那么方便,特別是參數(shù)方面,必須自己加空格分開,因?yàn)閑xec會(huì)把整個(gè)字符串作為shell運(yùn)行。

可能存在的問題以及解決方法

如果你覺得通過上面就能滿足你的需求,那么可能是要碰壁了。你會(huì)遇到以下情況。

沒權(quán)限運(yùn)行

這個(gè)情況我們團(tuán)隊(duì)的朱東方就遇到了, 在做DTS遷移的過程中,要執(zhí)行包里面的shell腳本, 解壓出來了之后,發(fā)現(xiàn)執(zhí)行不了。 那么就按照上面的方法授權(quán)吧

ProcessBuilder builder = new ProcessBuilder('/bin/chmod', '755', tempFile.getPath()); Process process = builder.start(); int rc = process.waitFor();

java進(jìn)行一直等待shell返回

這個(gè)問題估計(jì)更加經(jīng)常遇到。 原因是, shell腳本中有echo或者print輸出, 導(dǎo)致緩沖區(qū)被用完了! 為了避免這種情況, 一定要把緩沖區(qū)讀一下, 好處就是,可以對shell的具體運(yùn)行狀態(tài)進(jìn)行l(wèi)og出來。 比如上面我的例子中我會(huì)變成:

ProcessBuilder pb = new ProcessBuilder('./' + RUNNING_SHELL_FILE, keyword.trim(), taskId.toString(), fileName); pb.directory(new File(CASPERJS_FILE_DIR)); int runningStatus = 0; String s = null; try { Process p = pb.start(); BufferedReader stdInput = new BufferedReader(new InputStreamReader(p.getInputStream())); BufferedReader stdError = new BufferedReader(new InputStreamReader(p.getErrorStream())); while ((s = stdInput.readLine()) != null) { LOG.error(s); } while ((s = stdError.readLine()) != null) { LOG.error(s); } try { runningStatus = p.waitFor(); } catch (InterruptedException e) { }

記得在start()之后, waitFor()之前把緩沖區(qū)讀出來打log, 就可以看到你的shell為什么會(huì)沒有按照預(yù)期運(yùn)行。 這個(gè)還有一個(gè)好處是,可以讀shell里面輸出的結(jié)果, 方便java代碼進(jìn)一步操作。

也許你還會(huì)遇到這個(gè)問題,明明手工可以運(yùn)行的命令,java調(diào)用的shell中某一些命令居然不能執(zhí)行,報(bào)錯(cuò):命令不存在!

比如我在使用casperjs的時(shí)候,手工去執(zhí)行shell明明是可以執(zhí)行的,但是java調(diào)用的時(shí)候,發(fā)現(xiàn)總是出錯(cuò)。 通過讀取緩沖區(qū)就能發(fā)現(xiàn)錯(cuò)誤日志了。 我發(fā)現(xiàn)即便自己把安裝的casperjs的bin已經(jīng)加入了path中(/etc/profile, 各種bashrc中)還不夠。 比如:

export NODE_HOME='/home/admin/node'export CASPERJS_HOME='/home/admin/casperjs'export PHANTOMJS_HOME='/home/admin/phantomjs'export PATH=$PATH:$JAVA_HOME/bin:/root/bin:$NODE_HOME/bin:$CASPERJS_HOME/bin:$PHANTOMJS_HOME/bin

原來是因?yàn)閖ava在調(diào)用shell的時(shí)候,默認(rèn)用的是系統(tǒng)的/bin/下的指令。特別是你用root權(quán)限運(yùn)行的時(shí)候。 這時(shí)候,你要在/bin下加軟鏈了。針對我上面的例子,就要在/bin下加軟鏈:

ln -s /home/admin/casperjs/bin/casperjs casperjs;ln -s /home/admin/node/bin/node node;ln -s /home/admin/phantomjs/bin/phantomjs phantomjs;

這樣,問題就可以解決了。

如果是通過java調(diào)用shell進(jìn)行打包,那么要注意路徑的問題了

因?yàn)閟hell里面tar的壓縮和解壓可不能直接寫:

tar -zcf /home/admin/data/result.tar.gz /home/admin/data/result

直接給你報(bào)錯(cuò),因?yàn)閠ar的壓縮源必須到路徑下面, 因此可以寫成

tar -zcf /home/admin/data/result.tar.gz -C /home/admin/data/ result

如果我的shell是在jar包中怎么辦?

答案是:解壓出來。再按照上面指示進(jìn)行操作。

(1)找到路徑

String jarPath = findClassJarPath(ClassLoaderUtil.class); JarFile topLevelJarFile = null; try { topLevelJarFile = new JarFile(jarPath); Enumeration<JarEntry> entries = topLevelJarFile.entries(); while (entries.hasMoreElements()) { JarEntry entry = entries.nextElement(); if (!entry.isDirectory() && entry.getName().endsWith('.sh')) { 對你的shell文件進(jìn)行處理 } }

對文件處理的方法就簡單了,直接touch一個(gè)臨時(shí)文件,然后把數(shù)據(jù)流寫入,代碼:

FileUtils.touch(tempjline);tempjline.deleteOnExit();FileOutputStream fos = new FileOutputStream(tempjline);IOUtils.copy(ClassLoaderUtil.class.getResourceAsStream(r), fos);fos.close();

有這個(gè)這個(gè)東東,相信大家會(huì)減少踩坑,而且大膽地使用java和腳本之間的交互吧。 java可以調(diào)用shell,那么shell再調(diào)用其他就方便了。 記得一點(diǎn), 不要過度地依賴緩沖區(qū)進(jìn)行線程之間的通信。原因自己去學(xué)習(xí)吧。

總結(jié)

到此這篇關(guān)于Java程序去調(diào)用并執(zhí)行shell腳本及問題總結(jié)的文章就介紹到這了,更多相關(guān)java調(diào)用并執(zhí)行shell腳本內(nèi)容請搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!

標(biāo)簽: Java
相關(guān)文章:
主站蜘蛛池模板: 灵宝市| 莎车县| 丰镇市| 竹北市| 萍乡市| 凌云县| 大丰市| 芦溪县| 太谷县| 肃南| 石狮市| 衢州市| 岗巴县| 泰宁县| 罗江县| 忻城县| 互助| 衢州市| 那坡县| 黄平县| 通海县| 东兰县| 开远市| 永登县| 富顺县| 东台市| 临西县| 泰兴市| 萨嘎县| 驻马店市| 梓潼县| 驻马店市| 新兴县| 上高县| 庆阳市| 阳泉市| 察隅县| 大关县| 永靖县| 普兰县| 商南县|